Escolar Documentos
Profissional Documentos
Cultura Documentos
NOVIEMBRE 2005
SISTEMAS TUTORES INTELIGENTES PARA EL MODELADO DEL TUTOR
Resumen
En las carreras de ingeniería se ha observado, la existencia de grandes dificultades en
los aprendizajes de los estudiantes que se inician en el estudio de un lenguaje de
programación. Esto se evidencia cuando los estudiantes no pueden interpretar los
algoritmos debido a su mala preparación previa y a la falta de metodologías de trabajo,
por lo que requieren de una guía docente continua.
En este contexto, se busca modelar un tutor que permita definir y aplicar una estrategia
pedagógica para la enseñanza de las estructuras básicas de programación. Se pretende
dar los lineamientos que deben regir el comportamiento del tutor para adaptarse a las
necesidades del alumno para que el mismo pueda mejorar su rendimiento en la materia
sobre todo en los cursos muy numerosos.
Palabras clave: Estrategias Pedagógicas, Lenguaje Natural, Modelo del Tutor, Redes
Neuronales, Sistemas Asesores Inteligentes, Sistemas Expertos.
Abstract
It has been observed on the engineering careers, the existence great difficulties in the
learning’s of the students who are been initiating there’s studies of programming
languages. The students cannot interpret the algorithms due to their bad previous
preparation and to the lack of work methodologies, reason why they require of a
continuous educational guide.
In this context, it is intend to model a tutor who allows to define and to apply
pedagogical strategies for the suitable education of the basic structures of programming.
It is intend to give the basic rules that must govern the behavior of the tutor module to
adapt to the necessities of the student so that he can improve its yield in the matter.
Agradecimientos
En primer lugar quiero expresar mi agradecimiento al Prof. Dr. Ramón García Martínez,
Director del Centro de Ingeniería de Software e Ingeniería del Conocimiento (CAPIS)
del Instituto Tecnológico de Buenos Aires (ITBA) y del Laboratorio de Sistemas
Inteligentes (LSI) de la Facultad de Ingeniería de la Universidad de Buenos Aires
(FIUBA), y director de esta tesis. También a la Prof. M. Ing. Zulma Cataldi, Directora
del Laboratorio de Informática Educativa y Medios Audiovisuales (LIEMA) de la
Facultad de Ingeniería de la Universidad de Buenos Aires (FIUBA) y codirectora de
esta tesis. A ambos, gracias por la confianza depositada en mí desde el inicio de este
trabajo, por los consejos constantes y por la dedicación absoluta, tanto personal como
profesional, para que este trabajo saliera adelante.
A mis padres Celia y Alberto, a quienes les debo todo y es gracias a ellos que estoy
aquí. Sé que esto es muy poco para todos sus sacrificios, pero espero que este trabajo les
devuelva en parte tolo lo que me han dado.
Por último, y de manera más especial a Carolina. Muchas gracias por tu amor y apoyo
durante todo este tiempo. Por todo lo que me has aguantado, sabes que esta tesis
también es tuya.
Capítulo 1 – Introducción 14
1.1 - Introducción 14
1.2 - Descripción General del Problema 15
1.3 - Carácter del Problema 18
1.4 - Importancia de Encontrar la Solución al Problema 20
1.5 – Metodología de Trabajo 21
1.6 – Limitaciones e Implicancias 22
1.7 - Visión General del Trabajo 23
Bibliografía 138
Índice de Figuras
Capítulo 2 - Estado del Arte
Figura 2.1: Relación entre la IA, la Ingeniería del Conocimiento y otras áreas. 25
Figura 2.2: Esquema de una neurona artificial y una neurona humana. 37
Figura 2.3: Distintas funciones de activación para las neuronas artificiales. 38
Figura 2.4: Modelo de Hopfield de red neuronal artificial. 44
Figura 2.5: Modelo Backpropagation de red neuronal artificial. 46
Figura 2.6: Modelo S.O.M. de red neuronal artificial. 49
Figura 2.7: Impacto de las iteraciones sobre el resultado del entrenamiento. 52
Figura 2.8: Estructura clásica de un Sistema Tutor Inteligente. 57
Figura 2.9: Planilla de estilos de aprendizaje. 62
Figura 2.10: Ejemplo de interacción del sistema CircSim. 82
Figura 2.11: Solución del problema factorial. 82
Índice de Tablas
Capítulo 2 - Estado del Arte
Tabla 2.1: Comparación entre el cerebro humano y una computadora. 35
Tabla 2.2: Campos de aplicación de las redes neuronales artificiales 54
Tabla 2.3: Topologias de redes e hitos ordenados cronológicamente. 54
Tabla 2.4: Ejemplo de la planilla de resultado de los estudiantes. 63
Tabla 2.5: Características de los STI entre los 70’ y 90’ [Kinshuk, 1996] 67
Tabla 2.6: Paralelismo entre la concepción de Piaget y la de Vigotsky 70
Tabla 2.7: Características de los primeros STI orientados a la programación 86
Índice de Abreviaturas
ABAM = Adaptive Bidirectional Associative Memory
AG = Additive Grossberg
GA = Genetic Algorithms
HP = Heuristic Programming
IA = Artificial Intelligence
KE = Knowledge Engineering.
SG = Shunting Grossberg
El modelado de los Sistemas Tutores Inteligentes (STI) es una tarea compleja, ya que
implica considerar los módulos básicos de la arquitectura tripartida propuesta por
Carbonell [Carbonell, 1970] que fuera revisada luego por Self [Self, 1998] en forma
integral. A la hora de modelar un STI se deben considerar las características del
dominio (contenido), del comportamiento observable o mensurable del alumno (modelo
del alumno) y del conjunto de estrategias que serán abordadas por el módulo del tutor
en búsqueda de una enseñanza personalizada.
La selección del protocolo pedagógico más adecuado como resultado del análisis del
perfil del estudiante es uno de los factores mas influyentes a la hora de obtener buenos
resultados en las distintas sesiones pedagógicas, por lo tanto, se plantea la necesidad de
encontrar técnicas que determinen cuál es el mejor protocolo disponible en el sistema
(es decir, el que se adapte mejor a las necesidades del estudiante) para satisfacer cada
sesión pedagógica programada, teniendo en cuenta el desempeño anterior del estudiante
y otras características intrínsecas del mismo como pueden ser las preferencias del
estudiante y los contenidos a utilizar.
Con la implementación de los Sistemas Tutores Inteligentes (STI) que presenten las
características mencionadas se propone mejorar los rendimientos de los estudiantes en
las materias del área de Programación Básica1.
1
A esta área corresponden las materias Computación: Código 75.01 (para todas las carreras de Ingeniería
a excepción de Ingeniería Electrónica, Informática y Lic. en Análisis de Sistemas) y Algoritmos y
Programación I: Código 75.40 (para las carreras de Ingeniería Informática y Licenciatura en Sistemas) de
la Facultad de Ingeniería de la Universidad de Buenos Aires (FIUBA).
Esta selección y secuenciación del curriculum para los estudiantes requiere del uso de
mecanismos de planificación sofisticados que deben tener en cuenta la teoría de
tutorizado empleada haciendo hincapié en las necesidades del estudiante.
Se piensa que un sistema que pueda emular al tutor humano y que además provea al
estudiante de cierta flexibilidad para la elección del tipo de tutorizado más adecuado,
podría ser una solución factible para el problema planteado.
2
La Teoría Uno no es un modelo, ni un método de enseñanza, sino un conjunto de recomendaciones
compatibles con cualquier teoría. Ella estipula que “La gente aprende más cuando tiene una oportunidad
razonable y una motivación para hacerlo” [Perkins, 1995].
fin de que el alumno pueda comprender el tema [Hume et al., 1996; Evens et al., 1993].
Pero, analizando a fondo el problema y utilizando ambas teorías en forma conjunta se
podrían lograr una serie de pasos que pueden resumir la forma de impartir los
conocimientos [Freeva et al., 1996]:
· El tutor debe mantener una jerarquía de metas: Que debe cumplir mientras
imparte los conocimientos al alumno (el cual producirá un resultado que el tutor
no puede predecir de antemano).
Por otra parte, todas las interacciones entre el alumno y el docente, están enmarcadas en
las teorías de aprendizaje y de enseñanza aplicables a dicha interacción, lo que brinda
un marco teórico al problema citado, donde no solo es importante el conocimiento que
debe ser facilitado por el docente hacia el alumno, sino que cobra importancia la forma
en la que este conocimiento es presentado, ya que se pretende lograr la mayor eficiencia
posible en este proceso de adquisición y construcción de conocimiento. Se busca la
incorporación de los métodos y técnicas de enseñanza más eficaces que permitan
adaptar el modo de enseñanza a las necesidades del alumno a fin de mejorar los
resultados a través de cada clase o “sesión pedagógica” para cualquier dominio. Cada
alumno podrá elegir entonces la técnica de enseñanza que mejor se adapte a su estilo de
aprendizaje.
Si bien no está dentro de los objetivos de este trabajo el desarrollo de nuevos marcos
metodológicos para mejorar la interacción entre el docente y el alumno en el ámbito de
la enseñanza, se busca utilizar modelos y técnicas educativas probadas.
Por lo tanto, se tiene un problema que presenta características prácticas y teóricas, las
que de pueden describir como:
Se deben poder seleccionar los protocolos pedagógicos más eficientes para cada
sesión pedagógica a fin de impartirla del mejor modo posible con los recursos
didácticos disponibles. Éstos se pueden obtener del módulo del estudiante
(características del estudiante) y del módulo del dominio (que posee la
información concerniente a los conceptos que se utilizarán en la lección, así
como también las imágenes, ejercicios, videos, etc.).
3
También podría considerarse a distancia.
1. Introducción
2. Estado del Arte
3. Descripción del Problema
4. Solución
5. Propuesta Resultados
6. Bibliografía
A. Anexos
El objetivo básico de la tesis es redefinir el modelo del tutor para que un Sistema Tutor
Inteligente (STI) buscando establecer una relación entre los estilos de aprendizaje y los
protocolos pedagógicos para ofrecer una solución viable para reducir el alto porcentaje
de desaprobados en las materias de Programación Básica.
En el capítulo 2 se define el Estado del Arte, se dan las definiciones teóricas básicas y se
analizan los Sistemas Tutores Inteligentes (STI) en general y el módulo del tutor en
particular (sección 2.3). Se analiza el desempeño de las distintas implementaciones de
los STI realizadas hasta la fecha (sección 2.4), así como también las herramientas de la
Inteligencia Artificial (IA) aplicables.
En los Anexos se encuentran las tablas y los juegos de datos utilizados en el capítulo 5
para evaluar la solución propuesta, así como también los datos intermedios obtenidos
antes de la evaluación de la solución.
Algunas tecnologías como los agentes inteligentes, las redes neuronales, los sistemas
expertos y los Sistemas Tutores Inteligentes, que hace unos años solo existían en forma
teórica o en los ámbitos universitarios, se utilizan a diario en aplicaciones de uso
relativamente sencillo que se encuentran en la etapa de producción y no son solo casos
de estudio en los laboratorios universitarios. Además, estas tecnologías están
disponibles para las grandes empresas y los centros de alta tecnología, así como también
para aplicaciones pequeñas y medianas, que pueden utilizarlas a diario.
En los últimos años las tecnologías han evolucionado muy rápidamente y la Inteligencia
Artificial (IA) surge como una de las ramas de estudio más recientes y promisorias en el
campo de las Ciencias de la Computación. Ello hace que existan muchas aplicaciones
poco exploradas lo cual torna a este campo en un área interesante para los
investigadores, estudiantes y administradores que puedan utilizar en forma directa los
resultados de las investigaciones.
Es aquí donde la investigación sobre Inteligencia Artificial (IA) intenta asimilar estas
definiciones dentro de sus propias estructuras, incorporándolas en los Sistemas Tutores
Inteligentes (STI) que contemplan el aprendizaje humano y como la enseñanza con base
pedagógica. Es por ello, que el objetivo de este capítulo es presentar un marco
conceptual que de lugar al Estado del Arte de la Inteligencia Artificial (AI) y los
Sistemas Tutores Inteligentes (STI).
Hoy en día, el campo de la Inteligencia Artificial (IA) enmarca varias subáreas tales
como los sistemas expertos, la demostración automática de teoremas, el juego
automático, el reconocimiento de la voz y de patrones, el procesamiento del lenguaje
natural, la visión artificial, la robótica, las redes neuronales, etc [Castillo et al., 1998].
En la Figura 2.1 se pueden ver los subcampos dentro de la Inteligencia Artificial
[García-Martinez et al., 2003].
Inteligencia Artificial
Expertos
Sistemas
STI
Figura 2.1: Relación entre la IA, la Ingeniería del Conocimiento (INCO) y otras áreas.
[García-Martínez et al., 2003]
La inteligencia artificial (IA) surge así como una disciplina cuyo objetivo es proveer
técnicas para el desarrollo de programas capaces de simular la inteligencia que utilizan
los humanos para solucionar problemas en una gran cantidad de dominios
[Krishnamoorthy et al, 1996], por lo que la IA provee un conjunto de formalismos que
pueden representar los problemas, las herramientas y técnicas para resolverlos. Según
diversos autores [Krishnamoorthy et al, 1996; Newell, 1969] las actividades esenciales
asociadas con la inteligencia son:
· Encontrar similitudes entre situaciones, sin importar las diferencias que las
separan.
· Encontrar las diferencias entre situaciones, sin importar lo similares que puedan
parecer.
Por su amplio contenido, es difícil definir a la Inteligencia Artificial (IA), pero resulta
de interés para este trabajo arribar a un concepto esclarecedor, por lo que se expondrán
diferentes posiciones acerca de la IA.
Si bien existen muchas definiciones de Inteligencia Artificial (IA) en las que cada autor
la presenta de una manera ligeramente diferente, aquí se resumirán las más
representativas, agrupadas como lo propone Stuart [Stuart et al., 1995] en dos
categorías:
Haugeland en 1985 la definió como: “El nuevo y excitante esfuerzo de hacer pensar a
las computadoras”…”computadoras con mente, en el sentido completo y literal de la
frase”.
Según Charniak y McDermott en 1985 es: “El estudio de las facultades mentales a
través del uso de modelos computacionales”.
Para Kurzweil en 1990 es: “El arte de crear máquinas que realicen funciones que
requieran una cierta inteligencia cuando estas tareas son desempeñadas por
personas”.
Schalkoff en 1990 la definió como: “Un campo de estudio que busca explicar y emular
el comportamiento inteligente en términos de procesos computacionales”.
Para Rich y Knight en 1991 es: “El estudio para hacer a las computadoras realizar
tareas, en las que por el momento los humanos son mejores”.
Según Winston en 1992 es: “El estudio de la computación para hacer posible el
percibir, razonar y actuar”.
Todas estas definiciones mencionadas son válidas y cada una agrega un aspecto al
amplio campo de estudio que es la Inteligencia Artificial (IA).
Stuart [Stuart et al., 1995] reconoce que los primeros trabajos en Inteligencia Artificial
fueron realizados por Culloch y Pitts en 1943, quienes centraron sus investigaciones en
tres áreas fundamentales:
en 1953 [Turing et al., 1953] escribieron programas que jugaban al ajedrez ejecutados
en computadoras que seguían el paradigma de Von Newmann. Para esta misma época se
creo SNARC [Minsky, 1954], una red neuronal que simulaba 40 neuronas utilizando
3000 tubos de vacío y partes de un bombardero B-24.
Según Stuart [Stuart, 1995] en 1954 Newell y Simon ya tenían programas que podían
utilizar razonamiento lógico, utilizando la teoría lógica. Simon declaró haber inventado
un programa computacional capaz de pensar de manera no numérica. Pero fue, según
Stuart [Stuart et al., 1995], en los finales de la década de los cincuenta en la que se
adopto el nombre que McCarthy le había dado a este campo de la computación por más
de 20 años: Inteligencia Artificial.
Si bien en los comienzos de la década de los cincuenta el poder computacional era muy
limitado, se desarrollaron teorías que hoy son básicas en el campo de la Inteligencia
Artificial, sobre todo en el campo del pensamiento humano y los protocolos que las
personas utilizan a lo largo de la resolución de un dado problema [Stuart et al., 1995].
El trabajo de Winograd [Winograd, 1972] mostró cómo una gran cantidad de elementos
pueden unirse colectivamente para representar un concepto individual, incrementando el
paralelismo y haciendo más robustas las aplicaciones [Stuart et al., 1995]. Recién en
esta época, todos los trabajos expuestos respondían de manera satisfactoria a un
pequeño conjunto de elementos de prueba, pero fallaban a la hora de trabajar con el
4
MIT es el acrónimo de Massachussets Institute of Technology (Instituto Tecnológico de
Massachussets), institución dedicada a la ciencia, la ingeniería y la investigación, fundada en 1861 por el
geólogo William Barton Rogers.
En 1979 se publicó el informe Lighthill [Lighthill, 1973] que contenía grandes críticas a
la IA y por el cual el gobierno británico suspendió el apoyo a la investigación en el área
de la IA. A este informe se le suma que las posibles aplicaciones de los algoritmos
desarrollados hasta la fecha era muy pocas, poniendo el ejemplo de que un Perceptron
[Rosenblatt, 1958] (originalmente implementado como una simulación en una IBM®
704) de únicamente 2 entradas, solo podía representar un conjunto muy limitado de
situaciones, y no fue hasta 1980 en que se desarrolló el algoritmo de Backpropagation
[Werbos, 1990] para redes complejas multicapa.
En este período Buchanan desarrolla el programa Dendral [Buchanan et al., 1969] que
realizaba la tarea de resolver la estructura molecular de una sustancia a partir de la
información que provenía de un espectrómetro de masa. Este programa, según Stuart
[Stuart et al., 1995] funcionaba de forma aceptable para moléculas complejas, probando
con esto que las técnicas de la IA pueden ser aplicadas a dominios reales y no solamente
a casos de laboratorio. Este fue el primer programa utilizado que contenía información
sobre el dominio y las reglas para resolverlas, además se lo puede ver como uno de los
precursores de los KBES6. Una de las primeras aplicaciones útiles fue MyCin de
Feigenbaum, Buchanan, y Shortliffe [Buchanan et al., 1984], para el diagnóstico de las
infecciones sanguíneas. Constaba de aproximadamente 450 reglas y se comportaba tan
bien como un experto, y considerablemente mejor que un doctor recién recibido. Es una
de las primeras aplicaciones que integra las incertezas dentro del dominio como una
forma de emular la complejidad del dominio médico, ya que varias enfermedades
pueden tener los mismos síntomas, o una enfermedad puede casi no presentar síntomas
mesurables.
A partir del comienzo de la década de los ochenta, la Inteligencia Artificial dejó los
laboratorios para convertirse en una industria. Un ejemplo de ello es el Sistema Experto
(SE) “R1” utilizado por la Digital Equipment Corporation. Con este sistema la
5
Un problema del tipo NP (nondeterministic polynomial time) es aquel que es verificable en un tiempo
polinómico por una máquina no determinística de Turing, la cual puede seguir varios caminos
computacionales simultáneamente (con la restricción de que éstos no pueden comunicarse entre si).
Khachian demostró en 1979, que los problemas de la programación lineal eran del tipo P (polynomial
time) y no NP. [Borwein, et al, 1987]
6
Knowledge Based Expert Systems.
Más tarde, comenzó el período que Stuart [Stuart et al., 1995] ubica de la década de los
ochenta a la actualidad, donde no se desarrollaron nuevas teorías revolucionarias, pero
se intentó refinar las teorías ya existentes para su correcto funcionamiento. Por ejemplo
Tate (1977) y Chapman (1987), realizaron una síntesis de un programa planificador
dentro de un framework7 para facilitar el trabajo, el que fue utilizado incluso para
programar las misiones espaciales. También se vio un resurgimiento del razonamiento
probabilístico dentro de los sistemas inteligentes, como plantea Pearl (1978) y defiende
Cheeseman [Cheeseman, 1985].
A finales de la década de los noventa e inicio del siglo XXI, con el advenimiento del
mayor poder computacional y de las grandes capacidades de almacenamiento de datos
con costos de hardware más reducidos, se terminó por aceptar a la Inteligencia Artificial
(IA) como un campo práctico y no solo teórico, en el cual los desarrollos aplicables son
posibles más allá de los laboratorios. Esto llevó a continuar la tendencia de menor
investigación en nuevas teorías, refinamiento de las teorías actuales, y la generación de
miles de productos que se utilizan hoy en día, a nivel masivo como en actual “clippo”,
el asistente de Microsoft Word, que utiliza una red bayesiana para satisfacer las
necesidades del usuario del procesador de texto.
Como se mostró en la Figura 2.1, la Inteligencia Artificial (IA) comprende otras áreas
que son: los sistemas basados en conocimiento (KBES), las redes neuronales, la
ingeniería del conocimiento (INCO), los sistemas expertos y los Sistemas Tutores
7
Un framework es una estructura extensible para describir un conjunto de conceptos, métodos y
tecnologías necesarias para un diseño completo y posterior manufactura de software, es una interface
común integrada para el proceso de diseño, implementación, conversión de datos, etc. que facilita la
producción de, en este caso, la planificación de las misiones espaciales.
Inteligentes (STI). En lo que sigue, se describen someramente cada una de ellas para
lograr una idea completa del ámbito de la Inteligencia Artificial (IA).
Es un algoritmo ideado por Quinlan [Quinlan, 1993], dentro de los métodos inductivos
del Aprendizaje Automático, que aprende a partir de ejemplos preclasificados y se
utilizan para modelar las clasificaciones en los datos mediante árboles de decisión.
Estos algoritmos han tenido gran impacto en la Minería de Datos.
El C4.5 [Quinlan, 1993] junto con antecesor el ID3 [Quinlan, 1987] forman parte de la
familia de los Top Down Induction Trees (TDIDT). La idea de ambos algoritmos es de
considerar todas las pruebas posibles que pueden dividir el conjunto de datos de entrada
y seleccionar la prueba que resulta con mayor ganancia de información.
Para cada atributo discreto, se considera una prueba con n resultados, siendo n el
número de valores posibles que puede tomar el atributo. Para cada atributo continuo, se
realiza una prueba binaria sobre cada uno de los valores que toma el atributo en los
datos. Existen dos tipos de ejemplos:
Se pretende entonces que el conocimiento adquirido cubra todos los ejemplos positivos
y ningún ejemplo negativo, manteniendo que los ejemplos sean representativos de los
conceptos que se están tratando de enseñar. Además, la distribución de las clases en el
conjunto de ejemplos de entrenamiento, a partir de los que el sistema aprende, debe ser
similar a la distribución existente para los datos en los cuales se aplicará el sistema.
Los árboles TDIDT, se construyen basados en el método de Hunt [Hunt et al., 1975]. Se
parte de un conjunto de elementos T de entrenamiento:
{
TM [a 1(1) , a (1) (1) (1) (1) (2) (2) (2) (2) (1) (M) (M) (M) (M) (1)
2 , a 3 ,..., a n , C1- k ], [a 1 , a 2 , a 3 ,..., a n , C1- k ],...,[a 1 , a 2 , a 3 ,..., a n , C1- k ] }
Dadas las clases {C1, C2,. . ., Ck}, existen tres posibilidades:
Se elige una prueba basada en un único atributo, que tiene uno o más resultados,
mutuamente excluyentes y T se particiona en los subconjuntos donde Ti contiene
todos los casos de T que tienen el resultado Oi para la prueba elegida.
T=T1, T2,. . ., Tn
( ) ( )
H ( s i ) = - p i+ × log p i+ - p i- × log p i- (2.1)
n i+ ni-
p i+ = Ù p i- = (2.2)
ni+ + ni- ni+ + ni-
8
La entropía determina el nivel de caos o la azarosidad de un conjunto de datos. La entropía se define
como la cantidad de información que se espera observar cuando un evento ocurre según una distribución
de probabilidades. Para una distribución de probabilidades dada, la entropía mide la incertidumbre. Si
tomamos un conjunto con elementos positivos y negativos, la entropía variará entre 0 y 1. Es 0 si todos
los ejemplos pertenecen a la misma clase, y 1 cuando hay igual número de ejemplos positivos y negativos
en el conjunto de datos.
La probabilidad de que un ejemplo tomado al azar pertenezca a la clase i y se calcule en base a la
frecuencia de los datos de dicha clase en los datos de entrenamiento, se representa en la siguiente
fórmula:
N
H ( s i ) = -å - p i × log ( p i )
i =1
( )
H ( s i ) = - p i+ × log p i+ - p i- × log p i-( ) (2.3)
+ n i+ - ni-
p =
i Ú p =
i (2.4)
ni+ + ni- ni+ + ni-
N
H ( S , at ) = å p (s i ) × H ( s i ) (2.5)
i =1
si
p( s i ) = (2.6)
S
I ( S , at ) = H ( S ) - H ( S , at ) (2.7)
· ¿Qué parte del espacio predictor puede una regla capturar de manera exacta? O
sea, su captura.
Los árboles generados por los métodos del tipo TDIDT a veces no son óptimos para ser
utilizados en cualquier situación ya que puede producirse la sobregeneralización (u
overfitting), donde el gran tamaño del árbol o la evaluación de atributos poco
significativos llevan a árboles muy aptos para los ejemplos positivos, pero que
funcionan de manera pobre para los negativos. Se busca entonces la poda de los árboles
generados para su simplificación sin agregar demasiado error en la clasificación
resultante.
Una neurona es una célula viva que consta de un cuerpo celular relativamente esférico
de 5 a 10 micrones de diámetro, denominado soma, del que se desprende una rama
principal o axón y varias ramas más cortas llamadas dendritas. A su vez, el axón
presenta ramas en torno a su punto de arranque, y se ramifica extensamente en su
extremo.
Una de las características que diferencia a las neuronas de otras células, es la capacidad
de comunicarse, denominada en el campo de la biología como sinapsis neuronal. Las
dendritas y el cuerpo celular reciben señales de entrada, el cuerpo celular las combina e
integra y emite señales de salida. Estas señales pertenecen a dos naturalezas:
La Tabla 2.1 muestra una comparación entre las unidades fundamentales informáticas y
su similitud con las células del cerebro humano. Esta tabla se basa en el libro Artificial
Intelligence A Modern Approach de Stuart [Stuart et al., 1995] pero los datos
computacionales son llevados al año 2004.
Son modelos que intentan reproducir el comportamiento del cerebro que constan de
dispositivos elementales de procesamiento denominados neuronas artificiales. Una
definición global podría ser: “una red neuronal artificial es un procesador distribuido,
masivamente paralelo, que tiene una predisposición natural a almacenar conocimiento
experimental y hacerlo disponible para su utilización”.
Otras definiciones válidas son, las que plantea ARPA9 en su Neural Network Study
[DARPA, 1988] en la que una: “red neuronal artificial es un sistema compuesto de
muchos elementos simples de procesamiento operando en paralelo y cuya función es
determinada por la estructura de la red, fuerza de las conexiones y el procesamiento
llevado a cabo en los elementos individuales o nodos”. Por su parte, Kohonen plantea
[Kohonen, 1998] que: “una red neuronal artificial es un conjunto de redes
interconectadas masivamente en paralelo de elementos simples, usualmente
adaptativos, y con organización jerárquica, las cuales intentan interactuar con los
objetos del mundo real del mismo modo que lo hace el sistema nervioso biológico”.
Existen también otros estudiosos que han desarrollado definiciones similares, como
Haykin [Haykin, 1999] y Gurney [Gurney, 1995].
También existen definiciones que se aproximan más a los modelos biológicos, como la
de Zurada [Zurada, 1992], quien plantea que “una red neuronal artificial, es un sistema
celular físico que puede adquirir, almacenar y utilizar el conocimiento experimental”.
Independientemente de las diferencias en las distintas definiciones, el elemento clave
del paradigma de las redes neuronales artificiales son las estructuras novedosas del
sistema de procesamiento de la información.
9
Advanced Research Projects Agency (ARPA), creada por la directiva 5105.15 del Departament of
Defense (DoD) de los Estados Unidos. Su responsabilidad principal es el desarrollo de proyectos
avanzados en los campos de investigación y desarrollo que designe individualmente el Departamento de
Defensa. Antes de 1993 su nombre era DARPA (Defense Advanced Research Projects Agency).
http://www.darpa.mil. Consultado el 08/11/2005
Esta visión representa al cerebro humano como una máquina, que ostenta ciertas
cualidades de procesamiento de la información que la ciencia intenta imitar [Nilson,
2001].
El objetivo de una neurona artificial es recibir las entradas de las neuronas vecinas y
calcular un valor de salida que es enviado todas las neuronas conectadas con ella. Todas
las neuronas que componen la red se hallan en un determinado estado, pudiendo tomar
valores continuos o discretos.
Axónes
Vainas de Melanina
Entrada1 g1
q
Entrada2 g2
n Salida
Z = å X i × Wi
i =1 f (z )
Entrada3 g3
Entradan G
n
Asociada con cada unidad neuronal denominada U i existe una función denominada de
activación, f ( Neti ) , que transforma la entrada neta de la neurona en una señal de salida
yi (t ) = f ( Neti (t )) . La salida está dada por una función continua cualquiera definida
dentro de un intervalo. Toda función con límites inferiores y superiores y que posea un
incremento monotónico será una función de activación satisfactoria. Las funciones de
activación típicas son:
§ Función Escalón: la salida, que en este caso es binaria, solo se activa cuando la
entrada neta es mayor a cierto valor umbral predefinido:
10
Imagen tomada de Walsh, Anthony A. Sitio web http://inside.salve.edu/walsh/, consultado el
08/11/2005.
- 1 2×
( x - mi )2 Donde mi Es la media de la clase i y si Es
1 s i2
f ( x) = 2 ×e la varianza de la clase i
s i 2 ×p
En el campo de las redes neuronales, el aprendizaje es el proceso por el cual una señal
modifica los pesos de la red en respuesta a la información de entrada [Krishnamoorthy,
1996]. Existen dos criterios para clasificar el tipo de aprendizaje: el primero respecto a
la supervisión, que se divide en:
1 P N (k )
Errorglobal = åå
2 P k =1 j =1
( y j - d (j k ) ) 2 (2.8)
Siendo:
N: Número de neuronas de salida.
P: Número de informaciones que debe aprender la red.
Barto, Sutton y Anderson en 1983 [Barto et al., 1983] para redes de varias
capas con modificaciones para soportar el refuerzo.
Algunas redes neuronales que utilizan este tipo de aprendizaje son: Perceptrón
[Rosenblatt, 1958], Adaline/Madaline [Widrow, 1960], Backpropagation
[Rumelhart et al., 1986], Brain State-In-a-Box [Anderson et al., 1977],
Counterpropagation [Hetcht-Nielsen, 1988], Linear Reward Penalty [Barto et
al., 1983] Associative Reward Penalty [Barto et al., 1983], Adaptive Heuristic
Critic [Barto et al., 1983], Boltzmann Machine [Ackley et al., 1985], Cauchy
Machine [Ackley et al., 1985].
Este tipo de aprendizaje fue empleado por Hopfield 1982 [Hopfield, 1982;
Fausett, 1994], Grossberg lo utilizó en 1968 en la red Additive Grossberg
Algunas redes neuronales que utilizan este tipo de aprendizaje son: Hopfield
[Hopfield, 1982], Learning Matrix [Stuart, 1995], Temporal Associative
Memory [Wan et al., 1990], Linear Associative Memory (LAM) [Anderson et
al., 1988], Optimal LAM (OLAM) [Kohonen et al., 2001], Drive-Reinforcement
[Stuart, 1995], Fuzzy Associative Memory [Carpenter et al., 1992], Additive
Grossberg [Grossenberg, 1976], Shunting Grossberg [Carpenter et al., 1992],
Bidirectional Associative Memory (BAM) [Kosko, 1988], Adaptive BAM
[Kosko, 1988], Learning Vector Quantized [Kohonen, 2001],
Cognitron/Neocognitron [Fukushima, 1975; Fukushima, 1988], Topology
Preserving Map o S.O.M. [Kohonen, 2001], Adaptive Resonance Theory
[Carpenter et al., 1987].
Una segunda clasificación sobre la forma del aprendizaje es la que considera el estado
de la red durante el aprendizaje:
Algunas redes neuronales que utilizan este tipo de aprendizaje son: Adaptative
Grossberg [Grossberg, 1976], Shunting Grossberg [Grossberg, 1976],
Bidirectional Associative Memory (BAM) [Stuart, 1995], Adaptive BAM
[Kosko, 1988], Adaptive Resonance Theory [Carpenter et al., 1987].
Algunas redes neuronales que utilizan este tipo de aprendizaje son: Hopfield
[Hopfield, 1982], Learning Matrix [Stuart et. al, 1995], Temporal Associative
Memory [Wan et al., 1990], Linear Associative Memory (LAM) [Anderson et
al., 1988], Optimal LAM [Kohonen et al., 2001], Drive-Reinforcement [Stuart,
et al., 1995], Fuzzy Associative Memory [Carpenter et al., 1992], Learning
Vector Quantizer [Kohonen, 2001], Cognitron/Neocognitron [Fukushima, 1975;
Fukushima, 1983; Fukushima, 1988], Topology Preserving Map o S.O.M.
[Kohonen, 2001].
La topología es la disposición de las neuronas que forman la red, las cuales forman
capas o agrupaciones de neuronas que están alejadas en mayor o menor medida de la
entrada y la salida de la red. En este sentido, los parámetros fundamentales de red son:
· El número de capas.
· El grado de conectividad.
Se puede presentar también, una clasificación según el número de capas. En cada caso
se describirán brevemente las distintas implementaciones que existen para cada una de
ellas:
· Redes Monocapa: En las redes monocapa, las neuronas que componen la única
capa que existe, deben cumplir las tres funciones básicas de la red: de entrada de
datos, de procesamiento de datos y de salida de información. Pueden existir
conexiones autoconcurrentes o no. Algunas de las implementaciones más
conocidas son:
En la Figuras 2.4, 2.5 y 2.6 se ven los esquemas de los tres tipos de redes neuronales.
En la Figura 2.4 se ve una red neuronal del tipo Hopfield [Hopfield, 1982] con
conexiones recurrentes. En la Figura 2.5 se muestra una red neuronal del tipo
Backpropagation [Rumelhart et al., 1986], con capas ocultas y conexiones hacia
adelante y en la Figura 2.6 se ve el esquema general de una red autoorganizada del tipo
S.O.M. [Kohonen, 2001].
Retroalimentación
Entrada1 N1 Salida1
Entrada2 N2 Salida2
Entrada3 N3 Salida3
Entrada4 N4 Salida4
Entradan Nn Salidan
Capa de Capa de
Entrada Salida
Figura 2.4: Modelo de Hopfield [Hopfield, 1982] de red neuronal artificial. Es una red monocapa con
conexiones recurrentes.
· Segunda Fase: Los errores de las unidades de salida se transmiten hacia atrás,
pasando por todas las neuronas de las capas intermedias que contribuyan
directamente a la salida, recibiendo el porcentaje de error aproximado a la
participación de las neuronas intermedias en la salida original. Este proceso se
repite capa por capa hasta llegar a la capa de entrada y hasta que cada neurona
haya recibido un error que describa su aporte al error total.
En la fase de funcionamiento normal, los pesos no se modifican y por lo tanto, dados los
atributos en las neuronas de entrada, se obtienen las distintas activaciones de las
neuronas de salida como cualquiera de las redes neuronales que no cumplen con la
característica “Winner Takes All” (del inglés. el ganador toma todo) de esta sección.
Dado que la fase de funcionamiento es similar a las redes estudiadas se debe realizar un
análisis más profundo en el método de aprendizaje. El método de Backpropagation
utiliza una función o superficie de error asociada a la red, buscando el estado de mínimo
error estable a través del camino descendente de la superficie de error [Rumelhart,
1986]. Es por esto que de debe realizar la retroalimentación para realizar las
modificaciones en los pesos en un valor proporcional al gradiente decreciente de dicha
función de error. En la Figura 2.5 se puede ver un esquema de este tipo de redes
neuronales artificiales.
Entrada 1 N1 j
NO 1
1
NO 1
Entrada 2 N2 j
NO 2
1 S1 Salida 1
NO 2
Entrada 3 N3 j
NO 3
1
Entrada 4 NO 3 Salida m
Sm
N4 j
NO 4
1
NO i
Entrada n Nn j
NO k
Figura 2.5: Modelo Backpropagation [Rumelhart et al., 1986] de red neuronal artificial (NN). Es una red
multicapa, con conexiones hacia adelante y sin coneciones recurrentes.
Dada una neurona Ui y su salida Yi, el cambio que se produce en el peso de la conexión
que une la salida de dicha neurona con la unidad Uj(wij) para un patrón de aprendizaje p
es:
Pk = [a 1(k) , a (k) (k) (k) (k)
2 , a 3 ,..., a n , s n ] (2.9)
Dwij (t + 1) = a × d pj × Y pi (2.10)
Donde el rango de k cubre todas las neuronas a las que está conectada la salida de Uj y
el error que se produce en una neurona oculta es la suma de todos los errores cometidos
por las neuronas a las que está conectada su salida, multiplicados por el peso de la
conexión correspondiente.
Donde β es una constante que determina el efecto en la iteración (t+1) del cambio de los
pesos en la iteración (t). Esto permite la convergencia de la red en menor número de
iteraciones.
1. Se inicializan los pesos de la red con valores aleatorios w0, que pueden estar
entre 0 £ w0 £ z £ 1. 11
(
y pk = f jh Net hpj ) (2.15)
11
z es un valor determinado por el usuario que debe ser menor que 1 y representa el valor umbral de los
pesos aleatorios de la conexiones de la red.
æ ö
d pj = ç å d pk × wkj ÷ × f ' (Net j )
N
(2.17)
è K =1 ø
En ambos casos, la función de activación utilizada en cada una de las neuronas
debe ser derivable de primer orden. Se continuará el desarrollo del método de
Backpropagation utilizando la función Sigmoidal (11), que será utilizada en esta
tesis y es apta para salidas binarias.
f k (Net jk ) =
1
Net jk (2.18)
1- e
Por lo tanto, si se utiliza la función Sigmoidal como función de activación de las
neuronas se puede calcular el error de las neuronas de las capas ocultas:
æ ö
d pj = x pi (1 - x pi ) × ç å d pk × wkj ÷
N
(2.19)
è K=A ø
Entonces el error que se produce en una neurona oculta j es proporcional a la
suma de los errores conocidos que se producen en las neuronas a las que j está
conectada, multiplicadas por el peso de la conexión. Como las conexiones en
una red del tipo Backpropagation son solo hacia delante, los errores que influyen
son los de las neuronas K que se encuentran en la capa siguiente más cercana a
la salida (desde la A hasta la N).
6. Este proceso se repite una cantidad fija de veces o hasta lograr que el error
promedio de clasificación de la red sea aceptable [García-Martínez, 2003].
Puede existir el caso para el cual la cantidad de neuronas en las capas ocultas
sean insuficientes para reconocer los patrones de entrada con un error aceptable,
en tal caso debe modificarse la topología de la red para poder reconocer los
patrones mas complejos.
N
E p = 1 2 × å d pk
2
(2.22)
k =1
Existen evidencias que demuestran que las neuronas del cerebro se organizan en varias
zonas, donde la información captada del entorno, por los órganos sensoriales y se
representa internamente en forma de mapas bidimensionales. Si bien esta organización
puede estar predeterminada genéticamente, esto sugiere que el cerebro podría poseer la
capacidad de formar mapas topológicos de las informaciones recibidas del exterior. Esto
le brinda la capacidad de operar con elementos semánticos ya que algunas de sus áreas
simplemente podrían ordenar neuronas especializadas con características de alto nivel
construyendo mapas espaciales para atributos y características. En esto se basa Teuvo
Kohonen [Kohonen, 2001] quien en 1982 presentó un modelo de red neuronal con
capacidad para formar mapas de características. Kohonen plantea que un estímulo
externo por sí solo es suficiente para forzar la formación de los mapas y establecer
características comunes entre los datos de entrada a la red y su salida.
Las redes S.O.M. son modelos de redes con conexiones hacia delante (feedforward), y
conexiones laterales de inhibición (w £ 0) implícitas, para que cada una de las neuronas
de salida tenga influencia sobre sus vecinas. Esto es necesario para el entrenamiento,
donde solo una de las neuronas de salida se activará dado un vector p de atributos en la
capa de entrada. El entrenamiento es del tipo no supervisado y competitivo, utilizando
la técnica “Winner Takes All” o “el ganador se lleva todo”. Las redes deben ser
entrenadas Off-Line y luego, con los pesos de todas las conexiones fijos, puede ponerse
en funcionamiento normal. En la Figura 2.6 se ve un esquema de este tipo de redes:
Entrada 1 E1
Sn
Salida 1
Entrada 2 E2
S1
Salida 2
Entrada 3 E3
Sm
Salida m
Entrada 4 En
Figura 2.6: Modelo S.O.M. [Kohonen, 2001] de red neuronal artificial (NN). Es una red multicapa, con
conexiones hacia adelante y con conexiones recurrentes.
Los pasos a seguir para el entrenamiento de las redes del tipo S.O.M. son:
1. Se inicializan los pesos de la red con valores aleatorios w0, que pueden estar
entre 0 £ w0 £ z £ 1. 12
3. Las neurona j no solo recibe los datos pertenecientes al patrón P de entrada, sino
que también recibe la influencia de las conexiones laterales, cuyo valor Int es
una función que dependerá a la distancia a la que se encuentra j del resto de las
neuronas P (se suele utilizar funciones del tipo sombrero mejicano para
representar la influencia de la neurona p sobre la neurona j). La ecuación 2.23
representa el estado de la salida de la neurona j en el instante t+1.
æ N M ö
S j (t + 1) = f çç å wij × a i( k ) + å Int pj × S p (t ) ÷÷ (2.23)
è i =1 p =1 ø
4. Se encuentra ahora la neurona de salida vencedora como aquella cuyo vector de
pesos wj se asemeje más al patrón de entrada Pk. Puede utilizarse tanto la
distancia euclídea como la misma ecuación al cuadrado, lo importante es
encontrar la menor diferencia entre el peso wij de la neurona j y el
correspondiente elemento del patrón de entrada a i(k) que es componente i-ésimo
del k-ésimo patrón de entrada. La ecuación 2.24 representa el concepto de
“winner takes all” donde solo una neurona se activa al finalizar las iteraciones.
ì æ ö
å (a )
N
ï1 MIN Pk - W j = MIN ç 2 ÷
2
(k)
- wij
Sj =í ç 1 ÷ (2.24)
è i =1 ø
ï
î0 " otra Neurona
5. Una vez que se encuentra la neurona vencedora J* se actualizan los pesos de las
neuronas cercanas para crear el mapa autoorganizado asociando la información
con cierta zona de la capa de salida, llamada Zonaj*. Como en las demás redes a
es el coeficiente de aprendizaje asociado a la red que puede hacerse variar según
alguna de las opciones mostradas en las ecuaciones 2.26.
(
wij (t + 1) = wij (t ) × a (t ) × a 1(k) - w j * (t ) ) (2.25)
1 t
a (t ) = Ú a (t ) = 1 - (2.26)
t Tmax
12
z es un valor determinado por el usuario que debe ser menor que 1 y representa el valor umbral de los
pesos aleatorios de la conexiones de la red.
A lo largo de las distintas iteraciones que proporcionan los ciclos, por medio del
aprendizaje no supervisado, la red puede modificar la clasificación del elemento
k-ésimo del ciclo i-ésimo al ciclo i-ésimo+1. Con esto se lograrán agrupaciones o
familias de elementos mucho mas acertadas. En la práctica, para la mayoría de
los casos, se logra un valor de convergencia C, que si se supera no modificará la
clasificación de los elementos predicha por la red. En la Figura 2.7 se puede
observar la influencia de la cantidad ciclos en el entrenamiento de la red. La
figura muestra como una red o malla (donde cada unión del polígono es
determinada por una red S.O.M.) se puede ajustar a una región bidimensional
(en este caso de forma triangular). Se comienza con los pesos asignados en
forma aleatoria, pero como se puede ver, de la Figura 2.7.f a la 2.7.h existen
75.000 ciclos de entrenamiento y las diferencias en el modelo final son mínimas.
· Aleatoriedad: En cada ciclo, las observaciones que son presentadas una vez,
pueden ser tomadas en orden secuencial o en orden aleatorio. Si se selecciona el
orden aleatorio, el elemento original en la posición I de la grilla de entrada no
sólo será presentado aleatoriamente en una nueva posición J en la primera
iteración, sino que en la iteración posterior, será presentado en la posición K
(con K muy probablemente14 distinto de J), y así sucesivamente, modificando su
posición de presentación en cada una de las iteraciones precedentes.
13
Gráfico generado por el autor de la tesis con la aplicación WSOM de Christian Borgelt.
14
Dado que la distribución de probabilidad que se utiliza para seleccionar los datos es uniforme, todos los
elementos restantes del conjunto inicial tienen la misma probabilidad de ser elegidos para ser el próximo
dato a presentar a la red. Se puede calcular la probabilidad de un elemento que en la iteración i-ésima un
salió en la posición K, en la iteración i-ésima+1 este vuelva a salir en la posición K. El caso más simple
es para el primer elemento a presentar a la red en la iteración iesima, para el cual la probabilidad de salir
en la misma posición en la próxima iteración esta dada por:
1 1
P (0 ) = ¾reemplazan
¾ ¾¾ ¾do
® = 0,0082645
Cant . Elem. Re s tan tes 121
Los campos de aplicación de las redes neuronales artificiales son variados y están
planteados en distintos trabajos de investigación, como el desarrollado Cinca y Gallizo
Larraz. Una clasificación de los tipos de aplicaciones de las redes puede ser:
· Para reconocimiento: En este caso se entrena a las redes para lograr detectar
patrones específicos, como pueden ser sonidos, números, letras, lenguaje
humano escrito en general y representar el resultado en código ASCII,
UNICODE o cualquier otro.
La Tabla 2.2 resume los campos de utilización de las redes neuronales artificiales con
éxito.
Se puede agregar, a modo de ejemplo, más campos a la Tabla 2.2, como lo son las
apuestas y los juegos de azar, donde se debe analizar para determinar las cotizaciones o
premios de las distintas opciones; en la agricultura para detectar, por medio de
procesamiento de imágenes, frutas y hortalizas en mal estado; en química, para
identificar estructuras cristalinas de proteínas que se encuentran en imágenes de
microscopio electrónico y en la industria en general, para los procesos de obtención de
hierro y acero, manejo de stocks etc. la lista se extiende a muchos campos más que no
vale la pena exponer aquí. En la Tabla 2.3 se exponen las principales topologías de
redes, los investigadores que las desarrollaron y su fecha de aparición.
· La interacción puede ser muy variada en un STI: desde sistemas pasivos (que
esperan para que el alumno realice una acción), hasta los que constantemente
presentan nueva información (tutor oportunista), con casos intermedios en los
que se enseña un concepto en un momento determinado o solo cuando el alumno
lo pide.
Con estas consideraciones en mente, Guardia Robles [Guardia Robles, 1993] presenta
una definición para los tutores inteligentes: “Un Sistema Tutor Inteligente es un sistema
de enseñanza asistida por computadora, que utiliza técnicas de Inteligencia Artificial,
principalmente para representar el conocimiento y dirigir una estrategia de enseñanza;
y es capaz de comportarse como un experto, tanto en el dominio del conocimiento que
enseña (mostrando al alumno cómo aplicar dicho conocimiento), como en el dominio
pedagógico, donde es capaz de diagnosticar la situación en la que se encuentra el
estudiante y de acuerdo a ello ofrecer una acción o solución que le permita progresar
en el aprendizaje.”
Villareal [Villareal, 2003] plantea que los Sistemas Tutores Inteligentes (STI) simulan a
un tutor autoritario que posee una estrategia de enseñanza de los conceptos del dominio
del tipo uno a uno. Además es un experto en un dominio de conocimiento determinado
y actúa como guía, tutor o entrenador. Este tutor debe poder adaptarse a las necesidades,
que surgen a lo largo de la interacción en una sesión de tutelado, del estudiante alumno.
Los Sistemas Tutores Inteligentes (STI) tienen como principal objetivo impartir la
enseñanza de un contenido dado un dominio en la forma más adecuada a las
necesidades individuales del alumno. Estos sistemas se basan en una arquitectura
compuesta por tres grandes módulos: el módulo del tutor, el módulo del alumno y el
módulo del dominio [Villareal et al., 2001]. Podría agregarse un cuarto módulo
denominado el módulo de evaluación y, un quinto denominado módulo de interface y el
ecosistema propuesto por Cataldi [Cataldi, 2004].
1. Módulo del Alumno: Este módulo debe representar el estado inicial del alumno
y sus características individuales, entre ellas una de las más importantes es el
conocimiento individual instantáneo sobre el dominio [Villareal Goulart et al.,
2001]. Guardia Robles [Guardia Robles, 1993] lo define como: “El modelo del
estudiante, que refleja cuánto conoce el estudiante sobre el dominio, así como
las experiencias cognitivas y de aprendizaje que ha llevado, del cual puede
obtenerse un diagnóstico.”
2. Módulo del Tutor: Este módulo posee el conocimiento sobre las estrategias y
tácticas de enseñanza para poder seleccionarlas en función de las características
del alumno, que están almacenadas en el modulo del alumno [Villareal Goulart
et al., 2001]. Pero debe ir más allá de la experiencia en el dominio, ya que debe
ofrecer a cada estudiante un método de enseñanza de acuerdo con sus
necesidades.
Los primeros tres módulos conforman la arquitectura clásica propuesta por Carbonell
[Carbonell, 1970] y también funcional de los STI [Villareal Goulart et al., 2001] se
pueden ver en la Figura 2.8. Esta postura presentó grandes avances en el modelado de
ambientes educativos, ya que separó el dominio de la forma en la que éste es utilizado
[Villareal Goulart et al., 2001].
Interfaz
Figura 2.8: Estructura clásica de un Sistema Tutor Inteligente propuesta por Carbonell [Carbonell, 1970].
· Son dos sistemas expertos: Uno encargado de diagnosticar el estado actual del
alumno y otro encargado de decidir la mejor forma de retroalimentarlo en el
momento actual, cumpliendo el rol de asesor.
El diseño del modelo del estudiante se centra, según Barr [Barr et al., 1983] alrededor
de las preguntas: ¿Qué es lo que se desea que el estudiante sepa acerca del mecanismo
de resolución de una problemática? Qué tipos de conocimientos debe tener un
estudiante para poder resolver un problema de operación o reparación del
mecanismo?. De manera que el módulo del estudiante deberá tener conocimientos
acerca de [Sierra et al., 2003]:
La función central del módulo del estudiante, para Sierra [Sierra et al., 2003] se puede
resumir en el siguiente párrafo: “Para realizar inferencias acerca de lo que el
estudiante conoce, es necesario interpretar o hacer presunciones en base a las acciones
del estudiante. Estas interpretaciones constituyen la parte central en el desarrollo del
modelo del estudiante en el diseño de un Sistema Tutor Inteligente.”
Una definición de los estilos de aprendizaje puede plantearse como “los rasgos
cognitivos, afectivos y fisiológicos que sirven como indicadores relativamente estables,
de cómo los alumnos perciben interacciones y responden a sus ambientes de
aprendizaje [Keefe, 1988]. Por lo tanto se requiere una variedad de mediciones para
evaluar los estilos de aprendizaje de los distintos estudiantes y determinar su potencial
de éxito en una carrera de Ingeniería [Figueroa et al., 2004].
La información que se busca no está relacionada directamente con las formas que
describe Felder, sino que se busca la relación de los estilos de aprendizaje con los
modos de enseñanza o protocolo pedagógico para las sesiones pedagógicas con el
estudiante.
La planilla utilizada consta de once grupos de cuatro preguntas cada uno con dos
opciones de respuestas, así como también de datos adicionales que ayudaran a
categorizar a los estudiantes. Estos datos son:
· Año que cursa: Según el plan de estudios vigente para la carrera seleccionada.
Las planillas son anónimas en este punto del desarrollo, una vez categorizadas y
realizada la inferencia para determinar los estilos pedagógicos más efectivos para los
estudiantes, es decir que cada estudiante pueda seleccionarlo de acuerdo a su
preferencia. Un usuario del Sistema Tutor Inteligente (STI) deberá llenar por primera
vez la planilla para que el sistema realice una categorización inicial que luego podrá
llegar a ser modificada a lo largo del tiempo por el comportamiento del estudiante
dentro del sistema. Los estudiantes deben entregar la planilla con su nombre y número
de padrón, pero en esta etapa del análisis se ignorará este dato.
En la Figura 1.1 se pueden ver las preguntas utilizadas para el relevamiento de los 121
estudiantes (la justificación del tamaño muestral se encuentra en la sección 5.3.2
Validación del modelo).
De esta manera se toma una muestra que representativa de todas las carreras de la
Facultad y se evita que por la selección de individuos de una misma carrera, la
población sea extremadamente homogénea.
La planilla es entregada a los estudiantes en una hoja doble faz y se les concede el
tiempo que necesario para completar todas las preguntas de la encuesta. Una vez
recolectadas las encuestas estas son procesadas por el tesista y llevadas a un medio
digital utilizando la codificación que se puede observar en la sección A.2 – Planillas de
estilos de aprendizaje del Anexo A o los datos sin codificar como pueden observarse en
la sección A.3 – Valores de entrenamiento para la red S.O.M. del Anexo A.
Figura 2.9: Planilla de estilos de aprendizaje utilizada, tomada de Felder [Felder, 1998].
Recuperatorio
Primer Parcial
Práctico 1
Práctico 2
Trabajo
Trabajo
Final 1
Final 2
Final 3
Nombre y Apellido
1
(codificado)
Nicolás, A. 2 2 5 4 9 7 - -
Pablo Daniel, A. 2 6 - 4 9 4 - -
Roxana Maribel, A. 2 A 8 4 9 7 - -
Ignacio Pablo, A A 2 5 4 9 5 - -
Lucas Ariel B. 7 - - 4 9 5 - -
German B. 2 2 2 - - - - -
Tabla 2.4: Ejemplo de la planilla de resultado de los estudiantes.
Para poder construir el modelo de un proceso, debe ser posible descomponerlo en sus
partes constitutivas. Es decir, el mecanismo a ser modelado debe tener partes
identificables en las cuales pueda ser descompuesto.
Por lo tanto para el caso del módulo del dominio, se debe descomponer el conocimiento
de los temas para los cuales el sistema deberá ser experto. Entre ellos se encuentra el
conocimiento dependiente del dominio, compuesto por las definiciones, los conceptos
fundamentales y las agrupaciones de conceptos que forman los temas. También existe el
conocimiento independiente del dominio, el cual se compondrá de los diferentes
parámetros del sistema que se requieren para el correcto funcionamiento del mismo y
por último se encuentran los elementos didácticos que se utilizan para mejorar y facilitar
la experiencia del proceso enseñanza/aprendizaje.
2.3.4 – Interface
Se puede generar una interface que responda a la adecuación del usuario, donde este
establezca parámetros, como la letra, el tamaño de la letra, el color de fondo, etc., para
crear un ambiente de trabajo donde se sienta más cómodo y mejorando la sesión
educativa. El diseño es muy importante para la interface, ya que depende en gran parte
de los usuarios.
El sistema debe ser capaz de validarse, es decir, debe ser capaz de analizar el
desempeño que tuvo en las interacción con los alumnos y reorganizarse si su desempeño
fue inferior al esperado. Esta reorganización puede darse de forma automática, en
Sistemas Tutores Inteligentes (STI) más complejos, o en forma manual, modificando los
componentes que, dado el resultado de la evaluación, demostraron ser problemáticos o
estar pobremente adaptados a las situaciones a las que el sistema esta expuesto.
También el sistema debe se capaz de brindar los resultados de esta evaluación de forma
de informes, listados y datos procesados, para poder, por ejemplo, clusterizar los
alumnos en grupos definidos, detectar anormalidades o situaciones incorrectas, inferir
las causas y validar los datos obtenidos con el sistema en cursos pilotos, sin la
interacción del sistema, en los cuales se han tomados los mismos datos, para poder
verificar la mejora que resulta de la introducción del sistema tutor inteligente en el
ámbito educativo.
El sistema debe ser capaz de generar históricos de acuerdo a la solicitud del usuario y
debe poder mostrarlo de diferentes maneras. Estos módulos externos garantizan que el
funcionamiento del sistema pueda ser validado para nuevos casos de aplicación.
2.3.6.1 – Introducción
Según Wenger [Wegner, 1987], la visión clásica del papel del módulo tutor es tomar las
decisiones pedagógicas en función de las interacciones con el alumno. Estas decisiones
derivan de reglas o estructuras de conocimiento que representan el conocimiento del
tutor con respecto al dominio y están representadas en forma definida en el sistema.
Otra visión es la de García Martínez, compartida por Sierra [Sierra et al., 2003], donde
el módulo instruccional o módulo del tutor [Carbonell, 1970] es una representación de
los métodos que se usarán en el tutor inteligente para proveer información al estudiante.
Este modelo es complejo pues está pensado para dirigir al estudiante en su proceso de
aprendizaje y efectuar automáticamente ajustes en esta dirección a medida que el
estudiante progresa.
Para Sierra [Sierra et al., 2003] “En un sentido práctico, se tiene el siguiente problema
a resolver cuando se construye el módulo tutor de un Sistema Tutor Inteligente. El
estudiante está manipulando el modelo del dominio o mecanismo y el modelo de
estudiante está realizando inferencias en base a estas manipulaciones. El tutor debe
entonces hacer uso de esta información a efectos de proveer al estudiante con
información que sea útil para éste”. En su forma más general, a efectos de poder definir
correctamente la operación del módulo tutor, debe ser posible responder a las siguientes
preguntas: ¿Cuándo es necesario instruir? ¿Qué tipo de instrucción debe darse? Los
pasos metodológicos propuestos para el diseño del modelo del tutor son los siguientes
[Sierra et al., 2003]:
1. Analizar del modelo del estudiante a efectos de definir claramente cuáles son las
acciones que este puede llevar a cabo.
2. Interpretar adecuadamente las acciones definidas en el Paso 1 en función del tipo
de conocimiento que el estudiante debería poseer para llevar a cabo dichas
acciones en forma correcta.
3. En base a los diferentes tipos de conocimiento identificados en el paso 2,
determinar las estrategias de instrucción más apropiadas a fin que el estudiante
incorpore significativamente estos conocimientos a su estructura cognitiva.
En la década del setenta Carbonell [Carbonell, 1970] presentó una nueva postura, que
llevó a la práctica a través del sistema Scholar, donde tomó en consideración la forma
en la que el tutor estructuraba el contenido del dominio en el aula. El profesor recibe el
“feedback” de los alumnos e intenta inferir el estado cognitivo actual del alumno y a
partir de esto el modifica su comportamiento (a través de estrategias de enseñanza) para
que el alumno obtenga el mayor beneficio.
El Scholar es el primer programa para la enseñanza que utiliza una representación del
conocimiento basada en Inteligencia Artificial (IA) [Castillo et al., 1998]. Su principal
objetivo es enseñar la geografía de América del Sur a estudiantes de nivel primario. Es
el primer sistema en reconocer la posibilidad de separar el conocimiento de la materia a
estudiar del resto de la aplicación. Consta de una interface de línea de comandos
tradicional, donde Scholar plantea preguntas sobre el tema y el alumno las contesta. Se
evalúa la respuesta y se genera una retroalimentación. Cuenta también con un reloj para
indicarle al estudiante que está tardando demasiado [Carbonell, 1970].
Este enfoque pretende buscar una instrucción más personalizada, al contrario de los
CAI´s, en la que estos sistemas no realizan la tarea de enseñar en una única forma. El
sistema propuesto por Carbonell utilizaba redes semánticas15 para mantener un dialogo
con el alumno en formato textual utilizando un subconjunto de palabras del lenguaje
natural. Luego aparecieron trabajos como Why o Sophie de Collins y Brown [Stevens et
al., 1977].
Hasta ese entonces los términos CAI (o Intelligent CAI) y los Sistemas Tutores
Inteligentes (STI) eran considerados sinónimos [Villareal Goulart et al., 2001],
actualmente estos tipos se encuentran el área de IA-Education [Giraffa et al., 1999].
A través del análisis de la aplicación Scholar, Collins [Stevens et al., 1977] presentó el
proyecto Why, donde utilizó el método socrático de enseñanza siguiendo los
lineamientos propuestos por Carbonell [Carbonell, 1970]. En este caso el tutor socrático
enseñaba a través de la exposición indirecta, mediante las cuestiones sucesivas que se
requieren para formular los principios principales para poder analizar y evaluar las
hipótesis, descubrir las contradicciones y finalmente realizar las inferencias correctas.
Luego, se desarrolló el sistema Predicate Logic Advisory Tool denominado Plato que
enseñaba matemáticas a los niños de nivel primario. Plato generaba problemas y
presentaba “apuntes” al alumno. Uno de sus módulos estaba constituido por el juego
“How the West was won”, que consistía en usar operaciones matemáticas, para avanzar;
el juego incluye a West, el asesor inteligente que apoya al estudiante aprendizaje los
conceptos matemáticos asociados al juego. Se lo puede ver como el primer entorno de
aprendizaje completo [Castillo et al., 1998]. El paradigma utilizado es “Issues and
Examples” (temas pendientes y ejemplos). En él, se enumeraron todos los tipos de
combinaciones de operadores, a los que se llaman “temas pendientes”, es decir, lo que
15
Una red semántica es una estructura para la representación de conocimiento definida como un conjunto
de nodos interconectados por arcos rotulados. Las redes de este tipo sólo captan las definiciones de los
conceptos, también y de manera inherente proporcionan uniones entre otros conceptos [Chaiben, 1996].
al alumno le resta por aprender (esta es la información que debe ser utilizada en el
módulo tutor). Luego, se esperaba el momento oportuno para mostrarle los ejemplos de
cómo aplicar el tema pendiente y el beneficio que esto representa. Este paradigma es
aplicable, y se pueden construir STI en forma general estableciendo los conceptos a
enseñar (los “temas pendientes”); y reconocedores de patrones para saber si el
estudiante los domina o no [Castillo et al., 1998].
La Tabla 2.5 resume las principales características de los primeros Sistemas Tutores
Inteligentes que aparecieron, desde principios de la década del setenta hasta mediados
de la década de los noventa.
Existen diferentes teorías que explican el proceso del aprendizaje, que se pueden
agrupar en:
Los procesos de aprendizaje fueron tema de estudio desde siempre. Las primeras
reflexiones las expone Platón cuando en su libro La República [Platón, 2001], explica el
mito de las cavernas y aclarando que: “el mundo que se conoce es la proyección de
nuestras ideas innatas”. A esto se lo conoce como pensamiento racionalista. Luego,
Aristóteles, rechaza la teoría de las ideas innatas y establece que el conocimiento
procede de los sentidos que dotan a la mente de imágenes que se asocian entre si según
tres leyes: contigüidad, similitud y contraste, iniciando así el pensamiento
empirista. Estas teorías son reflotadas nuevamente, posteriormente, por Santo Tomás de
Aquino.
Las primeras aplicaciones de la CAI se dieron desde la visión conductista. Skinner año
muy influenciado por las investigaciones de Pavlov16 define al conductismo no como
una forma de estudiar la conducta sino como una filosofía de la ciencia dedicada al
objeto y a los métodos de la psicología. Skinner plantea que la conducta de los
organismos puede ser explicada a través de las contingencias ambientales, y los
procesos internos de naturaleza mental no tienen ningún poder causal-explicativo
[Hernández Rojas 1998]. En la actualidad el conductivismo ha evolucionado a modelos
cognitivistas más flexibles y adecuados que ponen en primer plano al estudiante en el
proceso educativo. A continuación se resumen los modelos más representativos y se
resaltan sus características principales.
Esta teoría establece que hay varios tipos de aprendizajes y que por lo tanto son
necesarios diferentes modos de instrucción. Estos tipos son: información verbal,
destrezas intelectuales: discriminar, formar conceptos, aprender reglas, estrategias
cognitivas, actitudes y destrezas motoras.
Para cada tipo de aprendizaje son necesarias diferentes condiciones internas y externas.
Una vez que plantea estos factores que afectan al aprendizaje, Gagné puede plantear al
proceso de aprendizaje como un sistema, donde dichas entradas afectan la salida; y por
lo tanto, el profesor puede mejorar la salida controlando las entradas. Gagné sugiere
agregar el concepto de jerarquía como base para su descripción del funcionamiento del
sistema.
Para Piaget [Piaget, 1989] existen dos tipos de aprendizaje, uno el aprendizaje en
sentido estricto, a través del cual se consigue información específica y otro, el
aprendizaje en sentido amplio, que consiste en el progreso de las estructuras de
cognitivas. El aprendizaje se produce cuando se presentara un desequilibrio o conflicto
cognitivo que da lugar a dos procesos: la asimilación y la acomodación.
16
Pavlov, médico ruso, le presentó la comida a los perros de su laboratorio y la introducía con el sonido
de una campana, por medio de mediciones, luego un tiempo comprobó que el sonido de la campana
provocaba salivación en los caninos, aunque el sonido no viniese acompañado de comida. Luego de años
evaluando los resultados experimentales, estos darían lugar a la teoría conocida Condicionamiento
Clásico de Pavlov, que aportaría, mas adelante, las bases para el Conductismo, escuela psicológica que
pretende explicar y predecir la conducta y que aporta luz sobre muchos de los aprendizajes no sólo en los
perros, también en los humanos.
Vigotsky [Vigotsky, 1926] plantea que “estudiar las conducta del hombre sin lo
psíquico, como pretende la psicología, es tan imposible como estudiar lo psíquico sin la
conducta. Por tanto no hay lugar para ciencias distintas. El estado actual de las dos
ramas del saber plantea insistentemente la cuestión de tal necesidad y fecundidad de la
completa fusión de ambas ciencias”.
Esta teoría está relacionada con la de Piaget, ya que enfatiza el aprendizaje por
descubrimiento. El alumno descubre, pues esto le causa mayor satisfacción y obtiene
una mayor retención. Llega un paso más adelante la teoría de Piaget, desarrollando un
proceso de instrucción donde el profesor debe crear un ambiente que favorezca lograr el
Bruner [Bruner, 1990] explica cómo el estudiante llega a dominar los contenidos que el
docente le propone construyendo el concepto de andamiaje, estrechamente ligado al de
zona de desarrollo próximo de Vigotsky. Según esta idea, en el proceso interacción y
diálogo en que se basa la enseñanza, el experto tiende un conjunto de andamios o
ayudas por medio de las cuales el alumno elabora las construcciones necesarias para
aprender los contenidos. El andamiaje debe contemplar los rasgos particulares del
alumno. Y se irán regulando en la medida en que vayan progresando en sus habilidades.
Así, algunos requerirán apoyos como explicaciones, modelos, etc., mientras que otros
necesitarán apoyos más complejos.
Gardner [Gardner, 2003] define una inteligencia como “La capacidad de resolver
problemas, o de crear productos, que sean valiosos en uno o más ambientes
culturales”. Este autor fundamenta su estructura en pruebas biológicas y antropológicas
y, más específicamente, en bases neurológicas, evolucionistas y transculturales. No
obstante, el autor aclara que es un acercamiento que no establece las fuentes de tales
capacidades o los medios para medir éstas. Gardner [Gardner, 1993] presenta una
clasificación de inteligencias, aunque sugiere que no es terminante:
· Verbal-lingüística. · Musical-Rítmica.
· Lógico-matemático. · Interpersonal.
· Visual-espacial. · Intrapersonal.
· Kinestésica. · Naturalista.
Para Gardner [Gardner, 1993]: “El objetivo de la escuela debe ser el de desarrollar las
inteligencias y ayudar a la gente a alcanzar los fines vocacionales y aficiones que se
adecuen a su particular espectro de inteligencias”. Este objetivo se consigue con una
escuela centrada en los individuos, donde la evaluación de las capacidades y las
tendencias individuales es continua.
Una vez presentadas las técnicas educativas mas importantes, se debe analizar cuales de
ellas son aplicables a la enseñanza de lenguajes de programación con paradigma lineal
estructurado y dentro de ellas, cuales son implementables en un asesor inteligente o un
sistema tutor inteligente.
Cualquiera de las teorías de enseñanza explicadas en los apartados anteriores resulta útil
para entender el proceso de aprendizaje de lenguajes de programación. La selección de
un marco teórico adecuado solo puede justificarse por medio de razones pedagógicas,
correspondientes al tipo de alumnos con el que se va a enfrentar al sistema y a las
técnicas de programación o características disponibles para el futuro sistema [Perkins,
1995]. A continuación se estudiará la aplicabilidad de cada uno de los modelos
anteriormente detallados a un Sistema Tutor Inteligente (STI) aplicado a la enseñanza
de la programación.
Por lo tanto se tomará la Teoría Uno planteada por Perkins [Perkins, 1995] como la
base teórica del Sistema Tutor Inteligente (STI), de la que se toman las bases de las
distintas formas de enseñanza disponibles. Perkins [Perkins, 1995] plantea que si se
combinan las condiciones que estipula la Teoría Uno con cada uno de los programas de
estudio, se obtienen los métodos respectivos. En otras palabras, la Teoría Uno se
“personifica” de distintas maneras según el programa del momento. Las cuatro formas
principales se enumeran a continuación y se explican más detalladamente en las
secciones siguientes:
A) La Instrucción Didáctica.
· Identificación de objetivos para los alumnos: Este paso quizás es uno de los
más importantes ya que establece cuál es el objetivo de la sesión pedagógica que
se está llevando a cabo y qué es lo que se pretende obtener como resultado para
los estudiantes una vez finalizada dicha sesión.
Las clases del tipo prácticas no quedan fuera de este modelo, sino que en ellas se alienta
a incluir exposiciones complementarias, para señalar vínculos entre los conceptos
familiares y los nuevos conceptos, aclarando las condiciones de aplicabilidad y de no
aplicabilidad de los mismos. La interacción siempre está liderada por el maestro o el
tutor relegando al estudiante a un segundo plano donde su único rol es el de asimilar la
información que se le está presentando, por lo tanto los elementos básicos de la
instrucción didáctica tienen que ver sobre todo con la claridad informativa.
B) El Entrenamiento.
El entrenamiento ofrece una respuesta, ya que hace hincapié en dos de las condiciones
planteadas por la Teoría Uno: la práctica reflexiva y la realimentación informativa. Las
principales actividades del docente entrenador consisten:
· Asignar prácticas.
· Alentar a los alumnos a reflexionar sobre lo que están haciendo.
· Ofrecer la realimentación.
Perkins [Perkins, 1995] plantea una analogía muy clara con respecto al fútbol: “El
entrenador observa desde afuera el desempeño de los deportistas y les da consejos.
Elogia los puntos fuertes, detecta los débiles, hace observar ciertos principios, ofrece
guía e inspiración y decide qué tipo de prácticas se deben enfatizar”. Y es esta función
tan importante la que se extrapola y se aplica en cualquier dominio, sea este fútbol,
clase de matemática o literatura.
C) La Enseñanza Socrática.
En este marco surge el método socrático, a través del cual se logra que los estudiantes
trabajen de una manera más flexible, pero no en forma libre, sino que continuamente
estén recibiendo el apoyo en sus investigaciones por parte de un maestro o tutor, pero
sin el esquema más rígido en el que el tutor les dice todo el tiempo lo que tienen que
hacer. Perkins [Perkins, 1995] plantea que de esta forma el estudiante debe aprender no
solo las respuestas sino que también el “arte de las preguntas”.
Uno de los conceptos claves de la Teoría Uno, es que el maestro socrático no provea
abundancia de datos, pero controle la claridad y la calidad de la información
suministrada por los alumnos haciéndoles preguntas. Cuando los alumnos discuten
entre sí sobre una determinada cuestión, el maestro socrático les exige una práctica
continua de reflexión. Provee además, realimentación inmediata por medio de estímulos
y críticas, e incita a que todos los participantes de la conversación hagan lo mismo.
Los protocolos pedagógicos propuestos por la Teoría Uno no son los únicos
acercamientos que proveen las características requeridas por la Teoría Uno:
“información clara, práctica reflexiva, realimentación informativa y fuerte motivación
intrínseca y extrínseca”. Existen otras aproximaciones como pueda serlo el aprendizaje
cooperativo y la colaboración entre pares, que vale la pena resaltar en el marco de los
asesores inteligentes, donde el sistema debe reaccionar como un “estudiante virtual”
que interactúa con los estudiantes usuarios del sistema para resolver los distintos
problemas que se le presentan y para lograr definiciones básicas para los conceptos que
se pretenden enseñar en una sesión pedagógica a través del “andamiaje” [Ausubel et al.,
1983; Guardia Robles, 1993] como lo hará un ayudante alumno.
Perkins [Perkins, 1995] sostiene que los niños aprenden mucho mejor en grupos
cooperativos bien configurados que en soledad. Por lo general, las agrupaciones
cooperativas pueden ayudar a lograr determinados fines, sin la planificación cuidadosa
que requieren los métodos como la instrucción didáctica y el entrenamiento. Los
resultados obtenidos son satisfactorios por que el aprendizaje cooperativo exige que
todos los participantes se hagan responsables del desempeño del grupo.
· El maestro “entrena” a los alumnos para que juzguen con criterios propios
adecuados a la circunstancia planteada.
· El maestro debe “aumentar” el interés intrínseco de los problemas que el mismo
presenta.
· El maestro puede “pedir a los alumnos que se califiquen mutuamente”, pero
ofreciendo una fuerte realimentación con respecto a qué tipo de respuestas
tienen más o menos sentido y por qué.
Esta teoría sobre la motivación intrínseca supera a la Teoría Uno por una razón muy
sencilla: la Teoría Uno no dice nada sobre las interacciones entre la motivación
intrínseca y la motivación extrínseca; sin embargo, hay muchas interacciones
importantes por las que hay que preocuparse cuando se quiere brindar una fuerte
motivación intrínseca.
Una de las ventajas principales, según Iglesias, Garijo y Gonzalez [Iglesias et al., 2001]
es la popularidad de las metodologías orientadas a objetos, para las que existen muchas
metodologías para implementar este paradigma, como es el caso de OMT (Object
Modeling Technique), OOSE (Object Oriented Software Engineering), OOD (Object
Oriented Design), RDD (Responsibility Driving Design) y UML (Unified Modeling
Language) entre otras. La experiencia adquirida con la utilización de estas metodologías
desde hace por lo menos una década puede dificultar la adopción de las metodologías de
agentes por la “inercia” que se genera en la industria, hasta tanto se disponga de una
propia.
Comenzando con las primeras implementaciones de los sistemas que seguían el modelo
de instrucción asistida por computadora (CAI), en la década de los setenta, aparecen
implementaciones como el sistema Scholar que lleva a la práctica la nueva propuesta de
Carbonell [Carbonell, 1970]. Esta es la primera implementación práctica donde el
sistema recibe un feedback de los alumnos e intenta inferir el estado cognitivo de los
mismos.
El proyecto Why de Collins [Stevens et al., 1977] seguía los lineamientos propuestos
por Carbonell, pero, explicando de modo socrático y por exposición indirecta. Todas las
aproximaciones a resolver el problema en la década del 70 eran muy rudimentarias y se
encuentran en desuso.
La década del 80 trajo modelos más diversificados. El tutor Quadratic podía modificar
sus estrategias pedagógicas, aunque de un modo bastante limitado, luego aparecieron
contribuciones informáticas (Internet, Videos, sonidos, etc.) a los STI a fines de los 80
lo cual aumentó la cantidad de elementos didácticos disponibles con los que el tutor
podía trabajar. Hasta ese momento toda la interface era en modo texto.
Actualmente hay que destacar el proyecto CircSim, Sistema Tutor Inteligente (STI)
creado en conjunto por el Departamento de Ciencias de la Computación del Illinois
Institute of Technology y el Departamento de Fisiología del Rush College of Medicine.
Este tutor es el más avanzado actualmente y su implementación se utiliza en el Rush
College of Medicine para complementar las clases teóricas sobre problemas
cardiovasculares [Kim, 1989; Kim, 2000; Cho, 2000; Hume, 1995; Shah, 1997; Hume
et al., 1992].
Dado que es el único gran tutor inteligente que realmente se está utilizando, esto hace
necesario estudiar sus características y motivaciones para evaluar los factores de su
éxito y analizar su puesta en operación para asistir a los estudiantes de medicina sin la
supervisión directa de un tutor humano.
La idea de este proyecto no es nueva, sino que viene de la década del 70, donde
MacMan propone un modelo matemático para el reflejo baroreceptor [Dickinson et al.,
1973], se generó una implementación para Fortran, con una interface simple donde solo
se podían modificar los parámetros de funcionamiento. Se realizaron luego distintas
codificaciones, pero no fueron muy utilizadas por que no resultaban útiles para la
enseñanza por varios factores [Kim, 1989; Kim, 2000; Cho, 2000; Hume, 1995; Shah,
1997; Hume et al., 1992; Woo Woo, 1991].
Como una mejora, nació el sistema Hearsim [Rovick et al., 1983] en 1983 el cual ya
contenía dos grandes componentes: el modelo matemático de MacMan y un segundo
componente llamado el módulo de enseñanza. Hearsim podía predecir el estado del
alumno en un momento dado y mostrar una tabla con las características más probables
del mismo. Si bien se realizaron muchas pruebas con este simulador, los estudiantes no
llegaron a utilizarlo.
En este entorno nace el CircSim programado en Basic para Microsoft D.O.S. ® [Rovick
et al., 1986] y su desarrollo se centra en que no todos los profesores de las escuelas
médicas pueden acceder a Plato [Walsh, 1987] y por lo tanto se les dificultaba el uso de
los programas anteriores.
Para hacer una analogía con el modelo planteado en esta tesis se pueden agrupar estos
componentes de la siguiente manera:
Además, posee unos 750 lemas así como también un léxico básico, complementado con
funciones léxicas y gramáticas que se utilizan para generar las frases. Como es
importante la corrección ortográfica de las frases para que el sistema pueda entenderlas,
existe un corrector que corrige automáticamente las palabras, que o bien son escritas
mal por los alumnos, o bien son mal abreviadas [Evens et al., 2001].
La corrección se basa en un algoritmo de tres vías, el cual abre una ventana para
preguntar las palabras que no se reconoció correctamente y las palabras candidatas a
suplantarlas. Para los errores más comunes, como elisiones (por ejemplo: del por de el,
al por a el), substituciones (por ejemplo: fusión por fusóin), etc. estos no se preguntan y
se toma el candidato más probable. [Evens et al., 2001]
Si bien esta solución de compromiso puede ser la única opción válida en el estado actual
de desarrollo de los STI, se podría modularizar en el marco teórico clásico de los STI lo
cual permitiría un cambio de dominio mucho más simple.
Otro problema del CircSim es que las variables que influyen en el reflejo baroreceptor
están relacionadas linealmente hacia un único objetivo, es decir, la respuesta final al
problema planteado por el CircSim es única. En la mayoría de los problemas en
ingeniería en general, y en los de programación en particular, un problema puede
admitir más de una solución satisfactoria, donde existen soluciones factibles o probables
y una o más que se revela como óptima.
S: CVP
T: Right, Central Venous Pressure determines filling, therefore determines
Stroke Volume.
T: The other determinant is neurally controlled. What is the other
determinant of Stroke Volume?
S: TPR
T: No, Total Peripheral Resistance is not a determinant. Stroke Volume is
determined by Central Venous Pressure and Inotropic State.
Figura 2.10: Ejemplo de interacción del sistema CircSim [Hume, 1995]. T es la pregunta generada por el
tutor y S es la respuesta del estudiante usuario del sistema.
El sistema Meno utiliza una serie de “plantillas” que representan las soluciones posibles
al problema planteado. Además contiene una base de datos con los errores más comunes
que realizan los estudiantes, para poder reconocerlos a través de un análisis del código
fuente. De acuerdo a los errores encontrados, se le presentan al alumno una serie de
sugerencias para corregir el programa, indicándole además, cuales son las causas de su
error y que conceptos aplicó en forma incorrecta o conceptos que desconoce [Castillo et
al., 1998]. Por otra parte, el tutor Proust de Carbonell [Carbonell, 1970] puede analizar
completamente el código fuente sin necesidad de utilizar plantillas como el Meno para
identificar las soluciones posibles.
Por lo tanto Coach [Selker, 1989] logró crear ayuda personalizada a cada uno de los
estudiantes usuarios y por medio de la observación de las acciones del usuario se
construye el modelo adaptativo del estudiante. Para describir a los estudiantes (usuarios
en el sistema Coach) Selker utilizó diversos modelos de usuarios, representados por
medio de “frames adaptativos”. Luego comparó los resultados entre los estudiantes
“asistidos” con el Coach y los estudiantes no asistidos para medir el éxito del Coach
como asistente de programación.
Otro tutor de Lisp es el ACTP [Russell et al., 2003] y es uno de los precursores en el uso
de modelado cognitivo en los Sistemas Tutores Inteligentes (STI) [Russell et al., 2003],
pero no llega a ser un asesor inteligente completo. Utiliza “plantillas de comparación”,
que son librerías de código común, para encontrar los errores que cometen los
estudiantes a la hora de escribir código fuente en Lisp. Este sistema podía detectar
pequeños, pero comunes, errores en código Lisp, con lo cual mejoró el conocimiento
global de los estudiantes.
El Tutor Capra de Fernández [Fernández, 1989] es otro tutor inteligente utilizado para
la enseñanza de programadores novatos; fue desarrollado dentro del marco de la
investigación del diagnóstico y detección de errores en entornos de programación. Este
tutor propone lidiar con esta problemática antes mencionada, mediante un tutor
inteligente que posea las siguientes características:
· Ejecución Simbólica
Una de las características más importantes que se puede observar en el Capra es que
esta construido en castellano, ya que fue desarrollado en España. Este es uno de los
primeros intentos para desarrollar un asesor inteligente en el idioma español.
Para lograr esto, el Meno Tutor utilizaba un sistema de plantillas, donde las soluciones
posibles a un determinado problema estaban estandarizadas y el sistema verificaba en
cuál de estas planillas podía encajar de forma satisfactoria la resolución diagramada por
el estudiante. De acuerdo a los errores encontrados según las planillas, se le presentan al
alumno una serie de sugerencias para corregir el programa, indicándole además, cuáles
son las causas de su error y que conceptos aplicó en forma incorrecta o conceptos que
desconoce [Castillo et al., 1998].
Otra de las desventajas de los tutores Meno radican en lo observado por Soloway y
Johnson [Johnson et al., 1986] donde no existían estudios empíricos para generar el
conocimiento de la programación que tenía el estudiante, es decir, no existía un módulo
respectivo en forma definida. Esta carencia no deja ver las diferencias entre los
programadores novicios y los expertos, quienes pueden adaptar las estructuras aplicadas
en otros lenguajes (como C o C++) a la resolución del problema original.
Es en este contexto que aparece el Tutor Proust de Carbonell [Carbonell, 1970] que
puede analizar completamente el código fuente sin necesidad de utilizar plantillas como
el Meno para identificar las soluciones posibles.
Luego de analizar las debilidades de los Meno Tutor, el nuevo Tutor Proust reconsidera
el problema del análisis de los programas y agrega conocimiento de la base de cada uno
de los estudiantes, quedando algo más definido de esta manera el módulo del estudiante.
A diferencia del Meno Tutor, el Proust está menos interesado en explicar los orígenes
de los errores en la programación que en solucionarlos, por lo tanto posee una estructura
más similar a un consejero que a un verdadero tutor.
Como contrapartida, el tutor Meno realizaba una comparación entre las funciones y
estructuras esperadas y las entregadas por el estudiante. El acercamiento del Proust, por
otro lado, realiza un diagnóstico sobre el proceso de diseño que distingue tres niveles
distintos:
De esta manera, se producen informes de cada uno de los errores de los alumnos mucho
más precisos, ya que se conocen los distintos pasos mentales que el estudiante daba para
hallar la resolución del problema. Por lo tanto, el Proust busca la interpretación más
plausible para el programa respecto a las especificaciones dadas y luego puede llegar a
inferir un diseño posible que se adecua a las intenciones del estudiante programador
novato. Esto le da la capacidad, al Proust, de poder detectar las diferencias entre un
error en el programa, con su correspondiente error conceptual, y el código fuente
inusual, pero en forma correcta.
Tampoco existe dentro del Proust una definición básica de los módulos fundamentales
propuestos por Carbonell [Carbonell, 1970], esto se debe a que generar un sistema tutor
inteligente es un proceso largo y delicado, donde se deben tener en cuenta aspectos que
corresponden a distintas áreas del saber, como puede ser la mejor codificación, en el
área de la programación y el estilo de aprendizaje del alumno, perteneciente al área
educativa, o los diseños de interfaces, para hacer llegar de manera correcta la
información al usuario del sistema, perteneciente al campo del diseño gráfico.
Otros Tutores Inteligentes, como el Bridge, son derivados del Meno y del posterior
Proust se basan en el estudio de los errores típicos de programación y se considera el
conocimiento inicial lingüístico que conlleva el aprendizaje de un nuevo lenguaje de
programación. Al tutor Bridge no se le ha agregado un sistema de diagnóstico eficiente
y en su lugar se utiliza un sistema más empírico que se desprende de los resultados
obtenidos del tutor Proust, ya que estos tutores son muy similares. Vale la pena resaltar
el caso del Tutor Capra de Fernández [Fernández, 1989] que es otro tutor STI, para el
diagnostico y detección de errores de programación. Éste es uno de los primeros
intentos para desarrollar un asesor inteligente en idioma español.
Ahora, tanto el Proust como el Meno Tutor, así como todos sus derivados, no son
Sistemas Tutores completos, ya que no presentan los nuevos contenidos, sino que solo
analizan los resultados de los conocimientos ya adquiridos por el estudiante y le
muestran los errores y le proporcionan una solución aceptable, esto coincide con la
forma de explicar los nuevos conceptos en forma socrática, soportada por la Teoría Uno
[Perkins, 1995], pero carece de una forma para modificar el protocolo pedagógico
conforme a las características de cada uno de los estudiantes, como pueden ser los
estudiantes novatos y los estudiantes que poseen una base de programación. En la Tabla
2.7 se pueden ver algunas de las características de los distintos tutores aplicados a la
enseñanza de la programación básica.
Método para
Tutor Estructura Proceso de Búsqueda Especialidad
detectar errores
Posee “creencias” acerca Las “creencias” del
del domino de aplicación sistema se obtienen de
El grafo se construye de manera
Construye un grafo y con respecto a la una base de datos y se las
bidireccional, propagando las
Advisor de dependencia de
restricciones que se derivan de una
solución planteada y el compara con los posibles
conceptos dialogo se realiza en caminos a tomar para la
tabla de datos.
términos de estas resolución de un
“creencias” ejercicio.
Esquema organizado Utiliza un proceso en línea de Realiza todos los análisis Esquema de errores
dentro de una ensayo de las expectativas del con respecto a los estandarizados y los
Flow estructura activa de sistema y su posterior estudiantes en línea, sin disparadores que pueden
red. confirmación (o no) demoras o retrasos. generar estos errores.
Es capaz de interactuar Utiliza el “bug finder”
Posee dos fases: primero construye entre múltiples metas u que consiste en una serie
un conjunto de hipótesis en forma objetivos planteados y de reglas para detectar
Posee una jerarquía
de una búsqueda Top-Down, luego forma la base de los errores. Como en Meno
de objetivos y le
Proust agrega los planes
realiza un análisis diferencial que Sistemas Tutores II, genera hipótesis de los
tienen en cuenta las intenciones Inteligentes como uno de posibles errores del
para cumplirlos
del estudiante asi como también de los tutores mas utilizados estudiante acerca del
errores estandarizados en ambientes educativos dominio por medio de
reales. casos almacenados.
Incorpora aspectos
La estructura de los globales en el proceso de
Utiliza el árbol de las
distintos planes se Depende de la “visión” lingüística diseño de algoritmos.
soluciones para comparar
Spade ve como un árbol y del plan, el que sugiere las Esto adiciona
la solución probable del
se analiza con un variedades de técnicas de parsing. condicionamientos que
estudiante.
parser. son puramente técnicos
(no del lenguaje)
Las encuestas de satisfacción realizadas en los cursos citados donde el tesista es docente
auxiliar, durante el periodo 2002-2004 evidenció que antes de comenzar con el dictado
de las clases el 10% de los alumnos utilizaban algún lenguaje de programación, y de ese
porcentaje, solo el 3% conocía lenguajes donde se puede aplicar el paradigma lineal
estructurado en la forma que requiere la materia. Luego de la interacción con los
alumnos a lo largo de seis cuatrimestres, se ha observado que estos porcentajes se
mantienen, por lo que se puede concluir que los alumnos no poseen un conocimiento
previo de los lenguajes de programación y mucho menos del paradigma lineal
estructurado.
Por otra parte, durante los seis cuatrimestres en estudio se efectuó el seguimiento de los
alumnos (a través de sus evaluaciones parciales y finales) a fin de saber por qué algunos
de ellos no llegaban a aprobar la materia en tiempo y forma. En esta Universidad, como
en otras, con asignaturas equivalentes en carreras relacionadas con la Informática y
Sistemas es preocupante la baja cantidad de alumnos que aprueban la materia. En la
mayoría de los casos este índice está en el orden del 30% [Madoz et al., 2000; Bruno,
2003].
Según Guardia Robles [Guardia Robles, 1993] para la enseñanza de los lenguajes de
programación, los profesores tienen como objetivos básicos que los alumnos adquieran
los conocimientos necesarios para desarrollar programas y sistemas computarizados que
resuelvan problemas reales.
Entre los problemas atribuibles al docente (sobre todo los novatos) se debe tener en
cuenta el desconocimiento de los distintos métodos de enseñanza y la falta de manejo de
las herramientas didácticas. También se evidencia la escasa base teórica para llevar al
alumno hacia un cambio conceptual de sus errores.
En este sentido, Guardia Robles [Guardia Robles, 1993] sostiene que: “Se ha dado
demasiado peso al papel del profesor como transmisor, y menor al del alumno como
receptor”, desde la visión tradicional que consideraba al docente como único transmisor
de los conocimientos.
Entre los problemas que se pueden atribuir al alumno se incluyen, las actitudes
negativas de algunos de ellos hacia el aprendizaje, el desconocimiento de metodologías
que les permitan encontrar las formas más apropiadas para evaluar las soluciones
propuestas y las maneras para optimizarlas. Por otra parte, durante las clases de práctica
en el laboratorio se observa que el tiempo para trabajo en máquina siempre es escaso,
debido a que los recursos disponibles deben ser compartidos entre los grupos de trabajo.
Proponer un modelo de tutor inteligente que sea capaz de adaptarse a las necesidades y
preferencias de los alumnos, según sus estilos de aprendizaje, para proveerles de una
herramienta adicional a través de la cual puedan recibir tutorizado “uno a uno”
independientemente del tiempo y la distancia en que éstos se encuentren.
Para lograr el objetivo general, se requiere de los objetivos específicos que se enumeran
a continuación.
A partir de los objetivos específicos, se desprenden una serie de interrogantes que deben
ser respondidos para que el objetivo general pueda ser cumplido. Se pueden formular de
la siguientes preguntas de investigación:
Pregunta 3: ¿En cuántos grupos o familias pueden organizarse los datos relevados de
los alumnos? ¿Es este número aceptable para una relación lineal con los
distintos protocolos pedagógicos?.
Pregunta 6: ¿Cada uno de los grupos o familias en las que los estudiantes se unen
pueden ser relacionadas con un protocolo de enseñanza específico? Si la
respuesta es afirmativa: ¿Con qué protocolo están relacionados?.
Por otra parte, los Sistemas Tutores Inteligentes (STI) analizados pueden responder a las
preguntas de los usuarios estudiantes, siempre y cuando la interacción esté iniciada por
el sistema, ya que éste debe realizar un proceso guiado de aprendizaje. En el caso en
que la interacción sea iniciada por el estudiante, el sistema no puede conocer de
antemano los objetivos a cumplir y por lo tanto no puede establecer el mejor camino
para llegar a ellos. Este tipo de interacciones, entonces, no se tendrán en cuenta para el
análisis de los distintos submódulos en la estructura del módulo del tutor dentro del
esquema de los Sistemas Tutores Inteligentes (STI).
Para diseñar e implementar un Sistema Tutor Inteligente (STI) que soporte la iniciativa
del alumno se requiere de un análisis adicional para detectar los patrones de
comportamiento y los casos particulares en que sus iniciativas pueden encontrar (o no)
situaciones útiles para lograr un objetivo dentro del marco del aprendizaje.
Por lo tanto, se analizará la integración de la Teoría Uno dentro del marco de los
Sistemas Tutores Inteligentes (STI) y la forma en que el sistema deberá responder a
cada uno de los distintos perfiles de los estudiantes de acuerdo a su estilo de
aprendizaje, realizando la menor cantidad de indagaciones a fin de obtener buenos
resultados para la sesión pedagógica con respecto a los recursos disponibles en el
sistema (en el módulo del dominio).
En esta sección se detallan los recursos necesarios para llevar a cabo la tesis. Se tratan
de recursos bibliográficos, tecnológicos y humanos.
distintos parámetros que la definen (entre los que se pueden citar el parámetro de
aprendizaje a (el valor inicial y el régimen de modificación a lo largo de los ciclos), el
momentum b, los pesos aleatorios iniciales, el vecindario gaussiano, la cantidad de
atributos que se utilizarán para el entrenamiento, la cantidad de las observaciones que se
utilizarán y las que se descartaran, justificando por qué se descartarán).
En promedio, el tiempo de entrenamiento de una red neuronal para los valores utilizados
en esta tesis es de aproximadamente 1.5 horas. Se entrenaron redes con más de 600
variaciones en los parámetros hasta encontrar los adecuados y los valores mínimos
correspondientes al error, lo que da un tiempo total neto de 38 días de entrenamiento.
Este proceso no puede realizase en forma completamente automática ya que es el tesista
quien debe variar los distintos parámetros y evaluar los resultados en cada caso. Los
recursos utilizados se enumeran a continuación:
Dado que el proyecto es desarrollado por una sola persona, el tesista, tanto la
planificación de las pruebas, el análisis de los resultados, las transcripciones y
codificación de las planillas y notas, la compaginación, la comparación de los resultados
y el entrenamiento de las redes han sido realizadas por la misma persona con la guía de
los directores. Debido a que las planillas para la toma de datos (los estilos de
aprendizaje) requieren de alumnos para la toma de los datos básicos se requirió:
· Dos cursos en los que se dicten las materias del área de Programación Básica y
que los docentes se puedan asimilar a dos de las formas básicas de enseñanza
que estipula la Teoría Uno de Perkins [1995]. Las distintas formas de enseñanza
de la Teoría Uno se encuentran detalladas en la Sección 2.3.3.4.2 - Técnicas
educativas aplicables.
Modulo
Dominio Modulo
Dominio
Modulo Modulo
Tutor Estudiante Modulo Modulo
Tutor Estudiante
Interfaz Interfaz
La definición de cada una de las tareas particulares de los módulos, permite realizar
agrupamientos de tareas en cada uno de ellos. A estos agrupamientos se los definirá
como submódulos pudiéndose realizar un análisis similar al de los grandes bloques del
sistema tutor inteligente, definiendo sus funcionalidades básicas y sus interfaces, para
permitir la independencia de los submódulos.
Los sistemas tutores inteligentes están en desarrollo desde hace más de quince años,
pero muy pocos realizaron la transición hacia el mercado comercial. Esta imposibilidad
de los STI para ser comercializados como productos de uso masivo se debe a:
· La relación Costo/Beneficio debe ser analizada para cada tutor, ya que todos los
módulos son desarrollados nuevamente para cada producto, deben ser probados
y debe ser evaluada la efectividad del modelo en cada caso, aumentando el costo
y el tiempo que insume el proyecto en forma global.
Por otra parte, se detecta una falta de lenguaje estándar para representar los
conocimientos en el módulo de conocimientos y de una interface que permita a las
distintas aplicaciones y a los distintos módulos acceder a ese conocimiento. Además, se
requiere desarrollar herramientas estandarizadas que permitan a los diseñadores de los
Sistemas Tutores Inteligentes (STI) manipular el conocimiento: obtenerlo y generar las
relaciones (de pertenencia, de correlatividad, de generalización, entre otras) con mayor
facilidad.
Las evidencias de las diferencias entre los modelos teóricos y los implementados surgen
en los planteos de Clancey y Joerger [Clancey et al., 1988] quienes se lamentan que
“...la realidad hoy es una empresa que solo experimentan los programadores” y la
mayoría del desarrollo teórico realizado en las últimas décadas no aportó mucho en
cuanto a la estandarización de los Sistemas Tutores Inteligentes (STI), ya que la mayor
parte de los investigadores se centraron en el desarrollo de tutores para aplicaciones
individuales o para aplicaciones muy dependientes del dominio.
Por otro lado, se puede ver que los Sistemas Tutores inteligentes (STI) son, en general,
construidos por programadores y profesionales del área de la informática que poseen
poca experiencia en el campo de las ciencias de la educación y teorías del aprendizaje.
Esto, en contraposición con el párrafo anterior, da como resultado sistemas que pueden
ser excelentes en términos de diseño, uso de recursos y rendimiento, pero que pueden
ser poco eficientes en la puesta en producción en un ambiente educativo real.
Por lo tanto, este trabajo surge motivado por las debilidades detectadas en el análisis y
la existencia de una falta de estandarización para generar Sistemas Tutores Inteligentes
(STI) reutilizables y de propósito general que puedan aplicarse a una gran diversidad de
dominios, en particular en lo referente al remodelado del módulo del tutor.
Tomando esta base se puede plantear la solución que se sustenta esta tesis. El problema
que se intenta solucionar se puede reformular entonces del siguiente modo: “Existe una
necesidad de desarrollar una arquitectura para los STI, de modo que sus componentes
puedan ser reutilizables por lo que se deberá contar con las herramientas apropiadas
de diseño (estandarizadas) que permitan desarrollar interfaces y submódulos con
funciones perfectamente definidas”.
17
Partes del código fuente que se encuentran “hard-coded” son partes que se definen de tal manera de
que no pueden ser modificadas sin recompilar todo el código fuente, a diferencia de los datos que se
obtienen del DBMS, bases de datos o sistemas mas primitivos de manejo de información.
Además de las necesidades de un mayor análisis sobre cada uno de los módulos
planteados por Carbonell [Carbonell, 1790] para desarrollar Sistemas Tutores
Inteligentes efectivos, éstos deben centrarse en las necesidades reales de los estudiantes
usuarios. Esto significa contar con los protocolos pedagógicos más adecuados de
acuerdo a las necesidades y las preferencias de cada usuario del sistema en particular
que tenga en cuenta la diferencia entre los distintos tipos de conocimientos a explicar: el
conocimiento declarativo, que incluye los hechos, conceptos y vocabulario y el
conocimiento procedural que incluye los pasos, las formulas y los algoritmos a utilizar
en la resolución de problemas. Es decir, la hipótesis principal se puede describir como:
“Un Sistema Tutor Inteligente (STI) que se adapte a las preferencias del estudiante este
obtendrá mejores resultados”.
Para el análisis se partirá del diagrama básico de los Sistemas Tutores Inteligentes (STI)
planteado por Carbonell [Carbonell, 1970] y Guardia Robles [Guardia Robles, 1993],
luego se ampliará ese esquema a los submódulos se ha detectado como faltantes
[Salgueiro et al., 2004] cuya falta ha sido comunicada por Cataldi [Cataldi et al., 2004],
por Costa [Costa et al., 2004] y por García-Martínez [García-Martínez et al., 2004]
planteando de este modo las necesidades básicas de cada submódulo y cómo estos
submódulos deben articularse entre sí para poder contribuir con partes completamente
independientes.
Si bien el desarrollo de esta tesis solo abarca con profundidad el modelado del tutor, no
se deben dejar de lado los otros módulos, ya que los datos que recibe o envía el módulo
del tutor deben proceder de (o dirigirse a) alguna parte, ya que no todos provienen
directamente del usuario. Estos datos solo pueden provenir de las interfaces con los
otros módulos, porque en caso contrario habría solapamiento entre los módulos.
De este modo, mantener la estructura teórica no es suficiente para que quede definido el
sistema sin superposiciones. Hay que considerar el listado de funcionalidades de los
módulos para que no se realicen dos veces las mismas tareas. La división de los
módulos en funcionalidades puede evitar el solapamiento, como se verá en el apartado
4.1.1.2 – Componentes básicos de los Módulos.
Interfaz
Figura 4.2: Estructura clásica de un Sistema Tutor Inteligente propuesta por Carbonell [Carbonell, 1970].
Modulo Evaluador
Modulo Dominio
Analizador
Protocolos Estilos Clasificación
de Perfil
Pedagógico
Generador
de Lenguaje Evaluador Usuarios
Natural Estudiantes
Interfaz
En los apartados siguientes se describen cada uno de los submódulos que se proponen
para el módulo del tutor. Se presentan las interfaces y las tareas especificas de cada uno
de los submódulos, comparándolos con los desarrollos actuales en los Sistemas Tutores
Inteligentes (STI) y se los ubica dentro de la estructura global del módulo del tutor.
En la Figura 4.4 se puede ver el esquema general del submódulo de los protocolos
pedagógicos, con sus dos componentes básicos: el analizador de perfil y la base de
protocolos pedagógicos disponibles. Este submódulo interactúa, con el resto de los
submódulos del módulo del tutor y además es el que realiza las peticiones de los datos
al módulo del estudiante, para saber cuál es el perfil de éste y su estado de
conocimientos.
Protocolos Pedagógicos
Analizador
Protocolos
de Perfil
Pedagógico
El sistema cuenta con una base de protocolos pedagógicos donde su uso estará
subordinado a la disponibilidad de los contenidos en el módulo de conocimientos, pero
la lección siempre se puede generar para alguno de los protocolos, o de una manera
incompleta para los protocolos que requieran más recursos didácticos. Esto se puede
aclarar a través de un ejemplo: cuando el sistema determina que requiere presentar un
contenido del tipo magistral de un tema en particular, pero el módulo de conocimientos
no contiene la cantidad suficiente de elementos didácticos como para que la sesión se
pueda completar, el sistema puede decidir que el material es insuficiente y cambiar a
otro protocolo pedagógico. En el peor de los casos, se mostrarán solamente las
definiciones de los conceptos y las relaciones básicas entre ellos, utilizando un mapa
conceptual como lo define Novak [Novak, 1988] que es la información o discernimiento
mínimo que puede poseer el módulo de dominio de un tema en particular.
Para obtener datos acerca del modo en que cada alumno aprende, se utilizarán las
planillas de estilo de aprendizaje que son herramientas para la toma de datos. Se ha
determinado la validez18 y confiabilidad19 de este instrumento a través de su aplicación
por diversos investigadores desde la fecha de su creación [Felder, 1990; Figueroa,
2004]. Partiendo de los datos que proveen las planillas se determinará el protocolo
pedagógico de preferencia para cada estudiante en particular.
Luego de la administrar el cuestionario a los alumnos, con esos datos se propone utilizar
las herramientas que proporciona la Inteligencia Artificial (AI), tales como las Redes
Neuronales (NN) a fin de obtener la relación de las preferencias de los estudiantes con
los protocolos pedagógicos. A partir de una muestra significativa estadísticamente20 de
estudiantes de los cuales se tienen las planillas de estilos de aprendizaje completas, se
verá como los estilos de aprendizaje permiten el agrupamiento de acuerdo a las técnicas
de enseñanza o protocolos pedagógicos. Esto permitirá correlacionar la preferencia del
alumno con la disponibilidad del protocolo pedagógico más adecuado existente en el
sistema.
18
Validez significa que la definición se ajusta al concepto y ésta debe referirse justamente a ese concepto
y no a algo similar, para asegurar que se está midiendo justamente lo que pretende y no otra cosa.
19
Confiabilidad se refiere a que si se repite la medición o el registro de información, el resultado será
siempre el mismo, independientemente del investigador.
20
Con un error de generalización menor al 3% para una población de 800 alumnos, el tamaño de la
muestra es de 120 sujetos, como se muestra en el apartado 5.2.1.
Las redes S.O.M. utilizan aprendizaje no supervisado, donde las salidas de la red no
poseen un valor esperado durante la etapa de entrenamiento, por lo tanto los “clusters”21
resultantes al aplicar la red S.O.M. a los datos de entrada, si bien poseen características
en común, estas no pueden verse a simple vista. En la Figura 4.5 se puede ver activa
solamente el conjunto Mc que mejor se adapta al patrón de entrada x. Existen también
otros conjuntos Mi que se concuerdan aceptablemente con x, en la zona de Mc.
Una vez finalizado el proceso de formación del mapa topológico obteniendo los cluster
o familias con características comunes, se agrega a cada uno de los individuos
pertenecientes a la población original el identificador del grupo generado por la red
S.O.M. para continuar con el análisis. En la Figura 4.6 se puede ver el esquema general
de una red neuronal del tipo S.O.M., donde se establecen los pesos Wij para todas las
conexiones entre las neuronas de entrada y las de salida.
W IJ
Dadas las entradas una
Salidas
Figura 4.6: Arquitectura típica de una red neuronal del tipo S.O.M.
21
Un cluster es una familia de datos o atributos que poseen características en común. Estas características
pueden ser explicitas o implícitas a los usuarios de los datos de la red.
Si bien existen varios algoritmos que realizan estas funciones, uno de los mas completos
es el C4.5 de Quinlan [Quinlan, 1993], que es una extensión del algoritmo ID3
(Induction Decision Trees) propuesto también por Quinlan [Quinlan, 1986]. Su objetivo
es generar un árbol de decisión y luego las reglas de inferencia que caracterizan a dicho
árbol. En este caso particular, el C4.5 tomará como entradas los datos de los estudiantes
ya categorizados y como salida se obtendrán reglas del tipo:
Se utiliza el C4.5 en lugar del ID3 ya que el primero permite trabajar con valores
continuos para los atributos, separando los posibles resultados en dos ramas: una para
aquellos Ai≤q y otra para Ai>q, (donde Ai es un atributo y q es un valor limite para el
cual todos los elementos de la regla menores a q se abren en un subárbol de reglas y los
mayores en otro). El algoritmo genera un árbol de decisión a partir de los datos
mediante particiones realizadas recursivamente. El árbol se construye mediante la
estrategia de depth-first (profundidad primero) considerando todas las divisiones
posibles del conjunto de datos. Se selecciona, luego, la división del conjunto de datos
que resulta en la mayor ganancia de información. En el caso particular de que existan
atributos discretos, se considerará una división por cada uno de sus n resultados.
C4.5, construye reglas que abarcan todos los datos, cubriendo todos los ejemplos
positivos y ninguno de los negativos. En el caso de existir un ejemplo negativo a una de
las reglas, se continúa avanzando en profundidad en el árbol de atributos. Además, el
algoritmo puede aceptar entradas incompletas que soluciona mediante pre o post
procesamiento, donde se reduce la cantidad de reglas generadas mediante pruning22
(truncamiento o poda), sin afectar la precisión de las reglas obtenidas. El resultado será
un conjunto de reglas que describen a cada uno de los clusters, pudiendo identificar las
características de cada una de las familias de elementos encontradas. En la Figura 4.7 se
puede ver un resultado gráfico posible como salida del algoritmo de inducción C4.5.
Para clasificar a un individuo dentro de los grupos establecidos se debe partir del nodo
denominado Root y se debe evaluar cada uno de los atributos hasta llegar a un nodo
terminal que contiene la clasificación final.
22
En el caso particular del algoritmo C4.5, el mecanismo de pruning funciona de la siguiente manera: una
vez creado el árbol de decisión sobre un conjunto de instancias de entrenamiento, se realizan ajustes al
árbol y se evalúa esta versión modificada contra un conjunto de instancias de validación. El algoritmo
solo mantiene los cambios si el árbol modificado o podado (pruned) se comporta de manera superior al
original. El uso de un conjunto de instancias de validación ayuda a eliminar el overfitting en la
información por medio de la evaluación de las inconsistencias y las coincidencias de este conjunto contra
el conjunto de instancias de entrenamiento. El error se reduce podando los nodos internos del árbol,
reetiquetándolos con la nueva clasificación y descartando todos sus nodos descendientes. Esto
obviamente limita el overfitting, pero es un proceso de costo computacional elevado.
Root
Nodo 0
Edad Edad
< 21 ³ 21
Nodo 1 Nodo 2
3
S: 35%
C: 100%
Sexo Sexo
Masc Fem
Nodo 3 Nodo 4
3 3 2 3 3
S: 50% S: 06% S: 5% S: 08% S: 0%
C: 95% C: 80% C: 100% C: 83% C: 100%
Figura 4.7: Árbol de decisión generado por el algoritmo C4.5 a partir de la clasificación obtenida
mediante la aplicación de redes S.O.M., donde S representa el soporte y C es la confianza de la regla.
Una vez obtenida la menor cantidad posible de reglas por medio de pruning (poda) para
evitar el overfitting23 (sobre ajuste), se esta en condiciones de pasar a otra etapa del
análisis en la que, por medio de un proceso de inferencia, se relaciona las reglas
descriptivas de los distintos clusters con los protocolos pedagógicos disponibles. Para
llevar a cabo la inferencia se cuenta con datos adicionales del desempeño de los mismos
estudiantes en los cursos en estudio con diferentes protocolos de enseñanza. En la
Figura 4.8 se puede ver el esquema que representa al proceso de selección en forma
global, donde se parte de una población de estudiantes de los cuales se posee sus
preferencias con respecto a los estilos de aprendizaje a través de las planillas, se los
agrupa usando S.O.M. Se arma una tabla de estudiantes clasificados, donde para todos
los atributos que describen a la planilla se le asigna un cluster Cj predicho por S.O.M. y
el algoritmo C4.5 se encarga de generar las reglas de describen a los clusters,
relacionando el cluster Cj no con todos los atributos, como en la tabla de estudiantes
clasificados, sino con un conjunto de reglas del estilo Si Pre1 y Pre2 y … Prem entonces
Cj.
Una vez identificadas las reglas que describen a cada uno de los clusters generados
como salida de S.O.M., se realiza una inferencia, planteando una serie de hipótesis, para
poder relacionar la relación entre los protocolos pedagógicos con los estilos de
aprendizaje relevados y agregar esta característica dentro del submódulo
correspondiente de un STI.
23
En el caso en que los datos relevados sean demasiado homogéneos (una varianza muy pequeña) el
algoritmo de inducción podría encontrar un modelo demasiado optimista, que satisface demasiado la
tendencia de los datos tomados, pero que a la vez es pobre para hacer predicciones para los datos que
tiene una varianza grande, los cuales pueden ser los más representativos del dominio.
Inducción
Submodulo 1 1 1
Si Pre 1 , Pre 2 , …, Pre n Entonces Ci
Reglas de los
Pedagógico
Clusters
Inferencia 2 2 2
Si Pre 1 , Pre 2 , …, Pre n Entonces Cj
Protocolos … …
Pedagógicos n n n
Si Pre 1 , Pre 2 , …, Pre n Entonces Ck
Figura 4.8: Esquema básico para la inferencia de los distintos patrones para categorizar los estilos
pedagógicos de los alumnos.
En esta etapa se busca relacionar los agrupamientos generados por S.O.M. con los
protocolos pedagógicos entrenando una red neuronal del tipo Backpropagation.
Para realizar la inferencia y relacionar los clusters obtenidos por medio de las redes
neuronales S.O.M. con los protocolo pedagógicos (ver sección 2.3.3.4.1 – Modelos
Enseñanza y Aprendizaje) se tomarán dos cursos (A y B) en los que se dictan materias
pertenecientes al área de Programación Básica. El único cambio fundamental entre
ambos se centró en la forma de enseñanza del docente, es decir, en el protocolo
pedagógico utilizado para dictar las clases.
Desde este marco de referencia, se evalúan dos cursos según el control de variables
planteado por García en el libro El Paradigma del Pensamiento del Profesor [García,
1995]. Las variables planteadas para los cursos de referencia son las siguientes24:
· Horarios Similares (dentro de un turno, como puede ser mañana, tarde, noche).
· Ingreso aleatorio de los estudiantes, sin preferencia definida por algún curso.
· Modo en el dictado de la clase, donde cada uno de los docentes presenta las
clases en función del protocolo pedagógico que le resulta más natural de llevar a
cabo entre las opciones posibles que se definen en la Teoría Uno y que se
analizan en esta investigación, independientemente de las necesidades o
preferencias de los estudiantes individualizados.
A partir del análisis de García, se observa para este estudio que la única que cambia es
la denominada “Modo de dictado de clase”, es decir, el protocolo pedagógico para cada
curso.
Se tomarán como base para realizar la inferencia los datos correspondientes a las
calificaciones en los primeros parciales, o las primeras oportunidades de evaluación
(que pueden incluir eventualmente los exámenes recuperatorios), ya que es el único
estado del que se poseen datos completos y donde el estudiante es precisamente un
novato en el tema.
En la etapa del final del curso, el estudiante ya ha puesto a prueba sus conocimientos
durante el examen parcial y conoce, por lo menos, la mecánica de algunos ejercicios y
la estructura general de las evaluaciones.
24
Se ha observado que en el aprendizaje, no solo impactan las variables antes mencionadas, sino que
también en el marco global de una clase para un grupo de personas, con uno o varios tutores humanos,
sólo puede explicarse utilizando un protocolo pedagógico que debido al número de tutores limitados,
no pueden individualizarse las necesidades de cada uno de los estudiantes, como casos particulares.
Esta limitación no la poseen los Sistemas Tutores Inteligentes (STI), sino que por el contrario, éstos
planean las sesiones en forma independiente para cada uno de los estudiantes usuarios, con objetivos
definidos en función de las necesidades instantáneas de los mismos.
Para validar esta afirmación se entrenó una red del tipo Backpropagation con las
siguientes características:
o Se seleccionaron los aprobados del curso con profesor que dicta en estilo
socrático más la mayoría de los reprobados del curso con profesor que dicta en
modo magistral y se entrenó la red considerando la salida como protocolo
socrático.
o Se seleccionaron los aprobados del curso con profesor que dicta en estilo
magistral más los reprobados del curso con profesor que dicta en modo socrático
y se entrenó la red considerando la salida como protocolo magistral.
Para realizar el entrenamiento de esta manera se debe suprimir el “ruido” que aportan
los grupos que quedan fuera del análisis (los que aprobaron con cualquier protocolo,
que se denominarán indiferentes y los que reprobaron por falta de estudio u otras
razones) y se espera que el error de la herramienta sea menor que el porcentaje de
elementos que quedan fuera del análisis. Por lo tanto, para cada cluster generado se
analizará:
25
Si un alumno pertenece al protocolo mayoritario (predicho por S.O.M) de los reprobados, es por que su
preferencia de protocolo pedagógico no coincide con el del curso en el que esta inscripto y debería
haberse anotado en otro.
Ahora se busca relacionar las formas de enseñanza y los estilos de aprendizaje, tomando
como base para el análisis a los estudiantes reprobados. En la Figura 4.10 se observa,
tomando como base un ejemplo en donde solo existen dos protocolos pedagógicos y dos
preferencias en el conjunto de estudiantes, que los estudiantes cuya preferencia coincide
con la forma o estilo de enseñanza no tienen problemas para aprobar. Existen dos
subconjuntos (en rojo) de estudiantes cuya preferencia no coincide con la forma de
enseñanza y son los que reprueban, ya que se encuentran “mal ubicados”.
Protocolo de preferencia
del Estudiante Problemática:
Magistral Socrático
Se analizan los estudiantes
desaprobados que prefieren
Magistral Reprobados. el protocolo pedagógico
invertido al utilizado al recibir
Tutor
Figura 4.10: Esquema general de la inferencia, para relacionar los clusters con los protocolos
pedagógicos.
Requieren de
Reprobados de un Curso Diferente
Curso (A o B)
Figura 4.11: Procedimiento para llevar a cabo la inferencia a fin de detectar a los estudiantes que no
coinciden con el protocolo pedagógico de su preferencia.
Por otra parte, en la Figura 4.11 se muestra la idea de la hipótesis, donde los alumnos
reprobados, que no pertenecen al cluster mayoritario, deben tener una preferencia de
protocolo pedagógico diferente al protocolo pedagógico recibido en las clases.
Existen además dos casos que no se encuadran en las ideas precedentes y que son:
Por lo tanto, si se analizan los datos provistos por los docentes de ambos cursos con
respecto a las categorizaciones realizadas por el sistema S.O.M., se puede obtener cuál
es el porcentaje de alumnos que estarían mal ubicados en los cursos, y que se
evidencian a través de los resultados reprobados obtenidos en las evaluaciones.
Para que el resultado obtenido sea satisfactorio, la red neuronal Backpropagation deberá
tener un error de clasificación menor al porcentaje de elementos que quedaron fuera del
análisis, de esta manera esta herramienta será útil para la clasificación de las
preferencias de enseñanza (protocolo pedagógico) de los estudiantes a partir de sus
estilos de aprendizaje.
Dado que las redes Backpropagation son redes neuronales artificiales multicapa, con n
capas ocultas y con conexiones hacia delante y no auto recurrentes [Werbos, 1990] se
deben establecer los parámetros para el funcionamiento óptimo (cantidad de neuronas
en las capas ocultas, cantidad de neuronas de entrada y salida, parámetros de
aprendizaje, etc.).
E1 Listado de
semejanza Conceptos
N1 porcentual
E2 Ns entre los datos
de entrada del
N2 estudiante y el Se verifica
E3 protocolo de que el
Ns salida. módulo del
Nn dominio
En posee los
datos
necesarios.
Figura 4.12: Estructura modificada de la solución, utilizando la red neuronal Backpropagation que
genera una lista de los protocolasen orden de preferencia.
D E E2 Ns
Protocolo Nn Protocolo
F G H Pedagógico En Pedagógico
(E) (E)
Al Planificador de
Al Planificador de
Lección
Luego de la selección del protocolo pedagógico, el paso que sigue es encontrar cuál es
el concepto a explicar en la lección, esto se realiza comparando el mapa de
conocimientos que se obtiene del módulo del dominio y los conocimientos que el
sistema supone que el estudiante posee que se obtiene del módulo del estudiante.
A A
B C B C
Submódulo de Lenguaje Natural
D E E
F G H
Generador de
Contenidos Stack de
Objetivos
impartir en la sesión
Los conceptos
Conocimientos a
D que aparecen A
punteados son la
pedagógica
Protocolo
Pedagógico “n” diferencia entre B C
los conocimientos
a impartir y los D E
conocimientos
actuales del
estudiante F G H
Submódulo Analizador de Perfil usuario
Figura 4.14: Esquema general de los pasos a seguir luego de la obtención del protocolo pedagógico por el
submódulo analizador de perfil y de la creación de los contenidos de la lección.
Una vez que las salidas son procesadas por el generador del lenguaje natural, estas se
envían directamente a la interface del sistema. Cuando el estudiante responde las
preguntas del sistema, es decir, continúa la interacción planteada por el sistema, todos
los datos son pasador desde la interface del sistema al módulo de lenguaje natural y de
este, parte la información procesada para convertirse en la entrada del generador de la
lección, el cual la evaluara y provocara las respuestas pertinentes. El esquema general
del funcionamiento del generador de la lección puede verse en la Figura 4.14 donde
gestiona sobre el módulo del estudiante los conocimientos del alumno y sobre el
módulo del dominio los conocimientos a explicar, los superpone y detecta los
conocimientos faltantes en la estructura del estudiante y seleccionando uno y utilizando
el protocolo pedagógico resultante del submódulo analizador de perfil se pasa a generar
los contenidos necesarios.
Por lo tanto se pueden redefinir las funciones básicas del módulo generador de
contenidos cómo decidir la forma de presentar al estudiante la información, el orden en
la que esta información se presentará y cómo se responderá a las interacciones del
estudiante usuario. Se pueden plantear los objetivos principales de este módulo como
las mencionadas por Woo Woo [Woo Woo, 1991]:
· Corregir los conceptos erróneos del estudiante para un problema dado y generar
el feedback en todas las respuestas del usuario hacia el sistema durante la sesión
pedagógica.
· El sistema debe responder las preguntas del usuario con la respuesta mas
apropiada dentro de todas sus opciones (Solo se están evaluando las
interacciones que son iniciadas por el sistema y no por el estudiante).
La determinación de los objetivos de la lección es una tarea esencial a llevar a cabo por
los Sistemas Tutores Inteligentes, ya que debe generar objetivos globales, coherentes y
consistentes para que estos sean impartidos a cada estudiante en particular. [Woo Woo,
1991]. Dado que cada uno de los conceptos almacenados en el módulo del dominio para
cada asignatura están relacionados entre sí, la secuencia en la que éstos se presenten
afectará de manera decisiva la performance del sistema en su conjunto y las necesidades
del estudiante. La determinación de los objetivos dejará planteada la estrategia del
sistema para una sesión pedagógica en particular.
Woo Woo [Woo Woo, 1991] plantea la determinación de objetivos utilizando como
base una “tabla de predicción” que almacena los resultados en el módulo del estudiante.
Estas ideas son implementadas en el tutor CircSim [Kim, 1989; Kim, 2000; Cho, 2000;
Hume, 1995; Shah, 1997; Hume et al., 1992] y pueden generar un planeamiento tanto
de tipo dinámico como de tipo jerárquico. El problema del CircSim es el mismo que se
resalta en la sección 2.3.5.1 – El Proyecto CircSim, que al ser un Sistema Tutor
Inteligente aplicado al dominio de la medicina, mas precisamente a las afecciones del
sistema circulatorio, posee módulos superpuestos.
Por otra parte no es el objetivo de una lección pedagógica obtener las dependencias del
módulo del dominio e impartirlas todas en una única “mega” sesión pedagógica, sino
que la idea de la flexibilidad de un Sistema Tutor Inteligente también reside en que este
sea capaz de evaluar los conocimientos adquiridos por el estudiante y actuar conforma e
ello. Es por esto que se requiere contrastar los datos del módulo del dominio con el
Figura 4.15: Esquema general para la selección de objetivos para la sesión pedagógica y
retroalimentación luego de finalizar dicha sesión.
Una vez que se determinan todas las combinaciones válidas entre los conocimientos
faltantes en el mapa de conocimientos del estudiante y los conceptos almacenados en el
módulo de dominio debe existir una función para determinar cuál de todas las
combinaciones será la seleccionada para la sesión en particular. Se debe tener en cuenta
que el número de opciones puede ser relativamente grande y éstas requieren un análisis
mas complejo, el cual no es el objetivo de esta tesis explicar.
Existen distintas opciones para implementar la función que determinará cual de todas
las opciones será la seleccionada para una determinada sesión pedagógica. Por ejemplo,
en el tutor CircSim [Kim, 1989; Kim, 2000; Cho, 2000; Hume, 1995; Shah, 1997; Hume
et al., 1992] se selecciona el objetivo de la sesión por medio de un conjunto de reglas
que toman como base los conocimientos del estudiante [Woo Woo, 1991], estas reglas
son tomadas de sesiones de educción de conocimiento con tutores humanos, pero fallan
nuevamente en la separación de los módulos, ya que los conocimientos resultantes a
enseñar deben provenir del módulo de dominio y no estar escritos en forma “Hard-
Coded” dentro del módulo del estudiante. Otra opción es, por ejemplo, la que se utiliza
en el tutor Meno [Woolf, 1984] donde se va avanzando linealmente por cada uno de los
temas de la curricula.
Este submódulo interactúa con varios componentes del Sistema Tutor Inteligente para
ejercer el control entre la interacción entre las preguntas y respuestas entre el sistema y
el estudiante. Cuando se procesan las respuestas a una serie de preguntas realizadas por
el sistema, el planeador de la lección debe decidir qué acción tomar a continuación,
siguiendo las pautas básicas del protocolo pedagógico seleccionado, por lo tanto el
planeador requiere conocimientos en cada punto de la lección para poder comunicarse
con el usuario, esto se logra a través de reglas o “guiones”, las cuales se obtienen de los
expertos por las técnicas de educción de conocimientos. Este proceso formal se lleva a
cabo utilizando la metodología para generar sistemas expertos.
26
LIFO es el acrónimo en ingles de Last In – First Out, o en castellano el último en entrar es el primero
en salir. Es la metodología básica para la operación de una estructura del tipo pila.
En este capítulo se describe cómo fueron obtenidos los datos y cuáles fueron los
procesos realizados a fin de generar las reglas de decisión para seleccionar el protocolo
pedagógico en el submódulo correspondiente en un Sistema Tutor Inteligente (STI).
Por lo tanto, el tamaño de la muestra corresponde con el 15% de ambas materias (el
20% de los alumnos de la materia Computación y el 11% de los alumnos de la materia
Algoritmos y Programación I).
27
Se tiene en cuenta la capacidad máxima de los distintos cursos, mientras que la matricula real puede
encontrarse por debajo de este numero y los errores obtenidos pueden ser menores. Se toma este
número como una cota superior máxima para todos los errores.
Para determinar el tamaño muestral mínimo se trabajó con el desarrollo que presenta
Hernández Sampieri [Hernández Sampieri, 2001] para el cálculo de la muestra. Se tiene
una población inicial de 800 estudiantes donde S2 es la varianza de la muestra n que
puede determinarse en términos de la probabilidad p donde:
V=0.03 (5.1)
El error de generalización está por debajo del 3% (tanto la muestra ajustada como la no
ajustada), con lo que se puede decir que el tamaño de la muestra es representativa para
todos los alumnos de las materias Computación y Algoritmos y Programación I.
El error para la generalización de los resultados es suficiente bajo como para utilizarlos
como entrada para el entrenamiento y posterior clusterización por medio de una red
tipo S.O.M.
Una vez relevados los datos utilizando las planillas, éstos fueron codificados para
realizar el entrenamiento de las redes neuronales S.O.M para agrupar estudiantes con
características comunes.
Los datos se codificaron en función de las respuestas de los estudiantes a las preguntas
de la Figura 5.1 de planilla de los estilos de aprendizaje en cuatro formas básicas, que
se explican a continuación y se pueden ver en la Figura 5.2:
21) Prefiero estudiar: (a) en grupo. (b) solo, corresponde a la respuesta solo, y
según la codificación utilizada será del tipo Reflexivo.
Para entrenar una red neuronal del tipo S.O.M., se requieren valores numéricos como
origen de los datos (reales o enteros) para el entrenamiento. En el caso de faltar alguno
de los datos de un campo, se lo puede reemplazar por el promedio de todos los datos de
ese campo para no alterar la tendencia de la información y para no desechar ese registro.
Esto llevó a buscar una tercera codificación en el caso de información faltante en las
planillas (o la información ambigua, en el caso de las dobles respuestas). Se resolvió
categorizarla con un estado adicional, llamado 2. Por lo tanto, para las respuestas de las
preguntas se poseen tres estados posibles, el estado 0, para las respuestas del tipo A. El
estado 1, para las respuestas del tipo B y el estado 2 para todas los demás tipos de
respuestas.
dígito y la cantidad de carreras relevadas es de 10, por lo tanto se las codifico del 0 al 9
como se muestra en la Tabla 5.3.
Carrera Código
Ingeniería Civil 1
Ingeniería Naval 2
Ingeniería Mecánica 3
Ingeniería Industrial 4
Ingeniería Química 5
Ingeniería Electricista 6
Ingeniería Agrimensura 7
Ingeniería Alimentos 8
Ingeniería Sistemas 9
Ingeniería Informática 0
Tabla 5.3: Codificación de las Carreras para
utilizar como entrada para la red S.O.M.
Las cifras de las edades, el año de ingreso y el año que actualmente está cursando el
estudiante son valores numéricos que no requieren una codificación previa para ser
procesados por la red, por lo tanto se los mantiene en el formato en el que son
relevados.
Esta codificación define las entradas de las redes del tipo S.O.M. de manera de que cada
uno de los atributos queda expresado en forma numérica, como solo soporta la
estructura de las redes autoorganizadas de Kohonen, ya que estas requieren trabajar con
los datos normalizados en el intervalo [0,1].
Una vez codificados los datos relevados, éstos fueron utilizados como entradas de una
red neuronal del tipo S.O.M. para obtener grupos de estudiantes con características en
común para intentar relacionarlos luego con los diferentes protocolos pedagógicos
utilizados en las sesiones con los estudiantes.
No alcanza con configurar las características de las redes S.O.M., sino que se le debe
proveer de datos para el entrenamiento y la validación de los resultados (en este caso los
de las planillas relevadas). También se deben configurar parámetros adicionales, de
manera experimental (ya que los coeficientes óptimos dependen de los valores
ingresados como datos) para lograr la mejor clasificación. En la Figura 5.2 se puede ver
como varía la clasificación predicha por una red S.O.M. entrenada con 200 datos si la
cantidad de neuronas de salida es 2 o si es 3 (en el primer caso se generan 2 clusters de
salida, mientras que en el segundo se generan 3 clusters de salida).
Parámetro Valor
Número de Observaciones 121
Número de Variables 47
Cantidad de Neuronas Artificiales28 10
Cantidad de Ciclos 1000
Aleatoriedad Si
Parámetro de Aprendizaje
Inicial 0.9
Final 0.1
Función de decaimiento Exp
Parámetro para el vecindario Gaussiano
Inicial 99,0%
Final 01,0%
Función de decaimiento Exp
Tabla 5.4: Parámetros utilizados para el entrenamiento de las Redes
Neuronales S.O.M. con los que se clasificaron los datos de los alumnos.
Una vez fijados los parámetros para el entrenamiento de la red, solo resta comenzar el
entrenamiento de las mismas para obtener los clusters de datos, que se analizarán en la
próxima sección.
28
Si bien el valor hallado es muy elevado con respecto a la cantidad de clústers que se forman, esto sólo
agrega un retardo temporal en el entrenamiento de la red. Los valores para el caso presentado obtienen
un resultado similar utilizando, por ejemplo, 3 neuronas (9 clústers como máximo) en lugar de 10
neuronas artificiales (100 clústers como máximo).
Una vez concluido el entrenamiento no supervisado de las redes S.O.M. con los
parámetros mencionados, en la Tabla 5.3 se procede al análisis de los datos resultantes.
En este paso se busca obtener:
Los resultados que arrojó el entrenamiento de la des S.O.M. se resumen en la Tabla 5.5,
donde los elementos de cada cluster generado se encuentran totalizados y se indican los
porcentajes respectivos.
Cluster 1 Cluster 2
Datos con todos los atributos 6 (5.00%) 114 (95.00%)
Tabla 5.5: Resumen de elementos resultantes luego de aplicar redes neuronales S.O.M. a
los datos de entrada.
29
Cabe mencionar que en el entrenamiento aparece un Cluster 3, compuesto para ambos casos
únicamente del elemento número 83, que codificado para transformarse en una entrada de la red
S.O.M. resulta de la siguiente manera:
Carrera
Edad
Sexo
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
0 20 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
Una codificación “2” indica que el estudiante completó en forma errónea la pregunta (o no marcó ningún
casillero, o marco ambas respuestas en la misma pregunta), por lo que una vez encontrada la planilla de
estilos número 83, lo que la diferencia de las demás resulta claro, solo la mitad de las preguntas fueron
Luego se buscaron, los atributos más relevantes para clasificar los clusters generados.
Para entrenar las redes S.O.M. los valores son normalizados entre cero y uno para
adaptarse a la estructura de la red.
El entrenamiento de las redes con todos los atributos (44 preguntas más 6 atributos
adicionales) o solamente con los que presentan mayor ganancia de información no
modifica la cantidad de elementos de los clusters, pero puede modificar las reglas
generadas por el algoritmo C4.5. Por lo tanto, se requiere ver cómo influyen esas
variables en la clasificación final.
En las Figuras 5.3 a y b se pueden ver los valores medios de los clusters generados
entrenando la red S.O.M. con todos los atributos, o con los 9 que presentan mayor
ganancia de información, observando que los valores medios se mantienen casi
constantes, salvo la observación número 92 que es clasificada en forma diferente en los
dos entrenamientos, pero pudiendo concluir que para esta etapa del entrenamiento es
indistinto si se discrimina o no por los atributos mencionados (existe una diferencia
porcentual del 0.82%).
Los dos clusters tienen valores medios “no triviales” (ni 0 ni 1) porque están
compuestos por más de una observación, entonces no es suficiente encontrar algunas
relaciones entre los clusters y los valores de entrada de los atributos, es necesario
encontrar todas las relaciones y S.O.M. no provee información suficiente para tal fin,
por lo que se requiere utilizar el algoritmo de inducción C4.5.
Carrera Carrera
Preg. 44 Edad Preg. 44 1 Sexo
Preg. 43 1 Sexo Preg. 43 Preg. 1
Preg. 42 Preg. 1 Preg. 42 Preg. 2
Preg. 41 Preg. 2 Preg. 41 Preg. 3
0,8 0,8
Preg. 40 Preg. 3 Preg. 40 Preg. 4
Preg. 39 Preg. 4 Preg. 39 Preg. 5
0,6 0,6
Preg. 38 Preg. 5 Preg. 38 Preg. 6
Preg. 37 0,4 Preg. 6 0,4
Preg. 37 Preg. 7
Preg. 36 Preg. 7 Preg. 36 Preg. 8
0,2 0,2
Preg. 35 Preg. 8 Preg. 35 Preg. 9
0 0
Preg. 34 Preg. 9
Preg. 34 Preg. 10
-0,2 -0,2
Preg. 33 Preg. 10
Preg. 33 Preg. 11
Preg. 32 Preg. 11
Preg. 32 Preg. 12
Preg. 31 Preg. 12
Preg. 31 Preg. 13
Preg. 30 Preg. 13
Preg. 30 Preg. 14
Preg. 29 Preg. 14
Preg. 29 Preg. 15
Preg. 28 Preg. 15
Preg. 28 Preg. 16
Preg. 27 Preg. 16
Preg. 27 Preg. 17
Preg. 26 Preg. 17
Preg. 26 Preg. 18
Preg. 25 Preg. 18
Preg. 24 Preg. 19
Preg. 25 Preg. 19
Preg. 24 Preg. 20
Preg. 23
Preg. 22 Preg. 20
Preg. 21 Preg. 23 Preg. 21
Preg. 22
Figura 5.3.a: Valor medio de cada una de las Figura 5.3.b: Valor medio de cada una de las
variables normalizadas en relación a cada uno de variables normalizadas en relación a cada uno de
respondidas por el alumno (una carilla del cuestionario), mientras que el anverso se encontraba en blanco
(probablemente el estudiante no se dio cuenta que debía llenar ambas páginas, anverso y reverso, del
formulario). En la codificación se hace evidente, que después de la pregunta número 18 (última del
anverso del cuestionario) todos los valores del juego de datos son 2, lo que significa según la codificación
implementada, que son preguntas sin contestar y por lo que se descarta este dato para el análisis posterior.
sus clusters (utilizando 44 preguntas más 6 sus clusters (utilizando solo las 44 preguntas para
atributos para el entrenamiento). el entrenamiento).
Para identificar las variables que más información otorgan al proceso de identificación
de los protocolos pedagógicos y para cuáles de ellas su entropía es menor, se utilizará
un algoritmo C4.5 modificado. Originalmente, este algoritmo de inducción generaba
árboles de decisión donde cada una de las ramas del árbol conducía, luego de n pasos, a
hojas las cuales representan al 100% de las observaciones sin error de categorización.
En este caso se optó por permitir leves márgenes de error en la clasificación, de manera
que el error de categorización de cada una de las reglas, sea de un valor igual o inferior
al error de generalización de la muestra, esto supone que se está llevando a un máximo
valor la “confianza” (para conocer la medida de la exactitud de las reglas generadas).
Se utilizarán los estudios de Oates [Oates et al., 1997] como base para asegurar que la
cantidad de observaciones tomadas (incluyendo el error de generalización) permitan
generar reglas que se pueden aplicar a toda la población, sin que los casos particulares
no relevados disminuyan significativamente la precisión de las reglas generadas.
Se analizarán dos casos para intentar procesar los datos: el primero incluye a las 44
preguntas de la planilla más los 6 atributos adicionales para realizar la clasificación,
mientras que el segundo solo utiliza las 9 preguntas que más información otorgan. Con
esta discriminación se busca:
Para resolver la primera cuestión se analizarán los resultados de aplicar C4.5 a los
atributos más relevantes, mientras que luego se aplicará al conjunto de todos los
atributos y preguntas. Una vez generadas todas las reglas, se deben analizar en forma
separada para ver:
· ¿Qué parte del espacio predictor puede capturar una regla de manera exacta? O
su captura.
Como todos los datos son categóricos, las reglas generadas serán igualdades y no se
encontrarán rangos para ellas (como en el caso de los datos continuos). Para encontrar
los atributos con mayor ganancia de información, se requiere utilizar los primeros n
pasos del algoritmo C4.5. En este caso se tomaron los primeros nueve, resultando las
reglas que se presentan en la Tabla 5.6
En la Tabla 5.7 se observan las características antes mencionadas para cada una de las
reglas generadas, así como también el cluster que definen y la cantidad de antecedentes
que poseen cada una de ellas (la columna “largo” indica la distancia entre el nodo raíz
del árbol y la hoja de esa regla, el largo del nodo raíz Root es 0 y el largo de un nodo
cualquiera es el largo de su padre más uno).
Nodo 1 Nodo 3
Si “Normalmente me
consideran: Reservado”
3 3
S: 36% S: 3%
C: 100% C: 100%
Nodo 5 Nodo 6
Si “Recuerdo más
fácilmente: Algo que hice”
3 2
S: 24% S: 2%
C: 100% C: 100%
Nodo 7 Nodo 9
Si “Aprendo: A tontas y locas
(Desordenadamente)”.
3 2
S: 29% S: 1%
C: 100% C: 100%
3 3 2
S: 4% S: 1% S: 1%
C: 100% C: 100% C: 100%
Figura 5.4: Esquema del árbol generado por el algoritmo C4.5. Se muestran los
nodos internos con sus valores y los clusters resultantes con su Soporte (S) y
Confianza (C) respectivamente.
árbol (root) y descender por los nodos interiores (numerados desde el 0, para el nodo
raíz hasta el 12) llegando a las hojas, donde se encuentra la clase resultante del camino
seleccionado y los datos asociados a su soporte y su confianza.
En la Tabla 5.8 se resumen los aspectos técnicos del algoritmo C4.5 y el tiempo
insumido en generar el árbol, podarlo y utilizar dicho árbol para evaluar el conjunto de
observaciones. En la misma tabla se detalla el porcentaje de datos mal clasificados en
las dos fases del algoritmo: la de entrenamiento y la de prueba posterior.
Característica Valor
Número Total de Nodos 12
Número de Nodos Hoja 9
Número de Niveles 5
% Error de Clasificación
En el conjunto de Entrenamiento 1.28%
En el conjunto de testeo 2.21%
Una vez analizada la representación gráfica del árbol, es necesario centrarse en cada uno
de los nodos, numerados de 0 al 12, para tener una idea precisa de cómo cada una de las
bifurcaciones influye sobre la clase resultante. De este modo se puede plantear un
ejemplo utilizando uno de los grupos de entrada cualquiera: seleccionando la
observación n=121 tal como se muestra en la Tabla 5.9, se buscará de clasificarla con el
árbol:
Protocolo Pedagógico Predicho 30
Protocolo Magistral
Carrera 9
Edad 19
Sexo Masculino
Entiendo un tema después de Pensarlo
Prefiero ser considerado como Realista
Cuando pienso acerca de lo que hice ayer, pienso en Imágenes
En general tiendo a Entender la estructura general
Cuando aprendo algo nuevo me ayuda Pensar acerca de ello
Si fuera profesor, preferiría enseñar En base a teorías e ideas
Prefiero obtener nueva información en forma de Dibujos y diagramas
Una vez que entiendo El tema en su conjunto
Estudiando en grupo, en temas difíciles Este sentado y escuche
Es más fácil para mi Aprender conceptos
En un libro con dibujos y esquemas Mire los dibujos y esquemas
Cuando resuelvo un problema de matemática Un paso a la vez
En el aula Raramente conozco a todos
Cuando leo libros que no son de ficción prefiero Libros de nuevos hechos
Prefiero docente que Muchos dibujos y diagramas
Cuando analizo una historia o novela Pienso acerca de los hechos
Cuando inicio la resolución de un problema Primero entiendo el problema
30
El valor 3 corresponde a la clasificación de la observación número 121 dada por la red S.O.M.
configurada con los parámetros mencionados en la sección A.3.3 – Clusters Resultantes del Anexo A.
Tabla 5.9: Observación número 121 como fue relevada de la planilla, con el cluster resultante
agregado luego de ser clasificado por el algoritmo C4.5
Para ver si esta observación está bien categorizada en el árbol se seguirán los nodos
desde el nodo 0 (root) descendiendo según los valores de los atributos de la
observación:
En este caso se repite el proceso de aplicar el algoritmo C4.5 a las planillas de estilos de
aprendizaje clasificadas por la red S.O.M. pero utilizando todas las preguntas y todos
los atributos disponibles, para analizar como impacta sobre el conjunto de resultados la
cantidad de atributos de la muestra.
En la Tabla 5.10 se resumen los aspectos técnicos del algoritmo C4.5 para el árbol
generado con el atributo de la edad. En la misma tabla se detalla el porcentaje de datos
mal clasificados en las dos fases del algoritmo, la de entrenamiento y el posterior testeo.
Característica Valor
Número Total de Nodos 18
Número de Nodos Hoja 13
Número de Niveles 6
% Error de Clasificación
En el conjunto de Entrenamiento 0.00%
En el conjunto de testeo 1.44%
Entonces, comparando las dos soluciones disponibles, las reglas generadas clasifican
aceptablemente a los 121 elementos, salvo que para el caso de utilizar solo 9 preguntas
de la planilla de estilos de aprendizaje, se recorren dos niveles de profundidad menos
que para el árbol generado teniendo en cuenta todos los atributos.
Ahora se debe analizar cómo influye el conjunto de entradas en la complejidad del árbol
resultante y como impactan las mejoras de los árboles complejos globalmente sobre el
modelo. Cuanto mayor sea la cantidad de variables a analizar, mayores serán los
requerimientos al módulo del estudiante y mayor será el trabajo que el STI en su
conjunto deberá realizar para satisfacer las necesidades básicas para poder seleccionar el
protocolo pedagógico más adecuado.
Oates [Oates et al., 1997] entre otros ha analizado varios algoritmos de “poda” (o
pruning en inglés) para recortar el tamaño de las reglas generadas a partir de un gran
número de observaciones. Oates ha encontrado que a medida que se aumenta el tamaño
de las observaciones iniciales, el tamaño de las reglas aumenta en forma lineal. Este
aumento en la cantidad de antecedentes de las reglas no aumenta significativamente la
precisión en la clasificación de las reglas.
Siguiendo a Quinlan [Quinlan, 1987], éste explica que si bien muchos sistemas han
desarrollados árboles de decisión complejos, acertados y eficientes, tienen la desventaja
de una complejidad excesiva que puede llevar a los expertos a la obtención de
resultados incomprensibles. Por lo tanto es cuestionable utilizar estructuras complejas,
si las simples se adaptan correctamente al modelo, introducen únicamente a un pequeño
error. En este aspecto Quinlan [Quinlan, 1987] esta de acuerdo con el trabajo The
Effects of Training Set Size on Decision Tree Complexity” [Oates et al., 1997] de Oates.
Según Last y Maimon [Last et al., 1998] la relación entre las entradas del modelo
(predicativas) y los objetivos (clasificación) se utilizan (dado el atributo de entrada) para
seleccionar los valores de las instancias que minimizan la función global de entropía de
ese atributo, una vez descartado ese atributo, se lo reemplaza por el valor seleccionado y
se continúan evaluando los atributos de igual manera hasta que todos los elementos
pertenezcan a la misma clase. Luego, se aplican los algoritmos de poda para minimizar
la profundidad de los árboles generados, sin perder el poder de clasificación.
De esta manera se llega a un resultado, para este caso en particular, como el propuesto
en los trabajos de Quinlan [Quinlan, 1986] y Oates [Oates et al., 1997] anteriormente
citados, brindado la ventaja adicional al utilizar el segundo árbol (con menos niveles y
menor cantidad de nodos), el Sistema Tutor Inteligente requiere menor cantidad de
información para seleccionar el protocolo pedagógico del estudiante y con información
de más fácil acceso (es más simple de conocer las respuestas a algunas preguntas claves
de la planilla que las respuestas a todo el cuestionario).
5.5 – Inferencia.
o Se seleccionaron los aprobados del curso con profesor socrático más la mayoría
de los reprobados del curso con profesor magistral y se entrenó la red
considerando protocolo socrático.
o Se seleccionaron los aprobados del curso con profesor magistral más los
reprobados del curso con profesor socrático y se entrenó la red considerando
protocolo magistral.
Realizando el entrenamiento de esta manera se logra suprimir el “ruido” que aportan los
grupos que quedan fuera del análisis. En la Tabla 5.11 se pueden ver los resultados de
los estudiantes discriminados por cursos, contabilizando alumnos totales, alumnos
reprobados clasificados como pertenecientes al cluster contrario al de la mayoría y el
porcentaje que relaciona a los alumnos reprobados y aprobados que además se
encuentran mal clasificados.
Para esta experiencia se entrenó la red del tipo Backpropagation y se obtuvo un ranking
(escala) de protocolos pedagógicos y no solo el más adecuado para una situación
particular, a fin de dar flexibilidad al módulo que almacena los contenidos. El esquema
de este tipo de redes se puede ver en la Figura 2.5 de la sección 2.2.4.5.1 – Redes
Backpropagation.
Característica Valor
% Error (Conjunto de Entrenamiento) 3.75%
% Error (Conjunto de Validación) 2.00%
Características de la Red
Neuronas de Entrada 13
Neuronas primera capa oculta 20
Neuronas Segunda capa oculta 20
Neuronas de Salida 2
Tabla 5.12: Resultados de los datos de entrenamiento de la red tipo
Backpropagation.
· El curso B está relacionado con el cluster 1: Ya que los errores inducidos por
elementos del cluster 2 dentro del Curso A están en un 75%. O en otras palabras,
la red clasifica al 75% de los estudiantes reprobados en el curso A como
pertenecientes al cluster B.
De esta manera se obtiene el mismo resultado del paso inferencial a fin de poder
incorporar los resultados experimentales al diseño del módulo tutor en el marco de los
Sistema Tutor Inteligente (STI).
Se concluye, que se posee un módulo del tutor capaz de categorizar a los estudiantes
según sus características, dentro de alguno de los protocolos pedagógicos disponibles en
el sistema, para el caso en estudio, se poseían datos de 2 protocolos pedagógicos
(Magistral y Socrático) y en este caso se puede categorizar automáticamente a los
estudiantes dentro de cada uno de ellos, según sus preferencias para mejorar los
resultados de una sesión pedagógica.
Una ventaja adicional que se presenta al utilizar una red del tipo Backpropagation en
lugar de una red S.O.M. para entrenar en la detección del protocolo pedagógico más
adecuado es que la primera no solamente proporciona una única salida, sino que en
lugar de activarse una única neurona de salida, ambas neuronas se activan (tanto la que
indica el protocolo Magistral como el Socrático) entregando un puntaje, que es la
relación entre los datos de entrada y el elemento que representa esa neurona en
particular. De esta manera, en los casos donde se posean varios protocolos pedagógicos
en los cuales se pueda optar, se podrá seleccionar el segundo más adecuado si el
primero faltase en el módulo del dominio y así sucesivamente.
Esto se puede ilustrar por medio de un ejemplo, en el que la observación número 120 es
clasificada por la red Backpropagation entrenada. La neurona que representa al
protocolo pedagógico Socrático en la observación de entrada le obtiene un puntaje de
0.00453776, mientras que la neurona que representa al protocolo pedagógico Magistral
obtiene un puntaje de 0.99432725, por lo tanto el sistema decide implementar la sesión
de tutoría utilizando el protocolo pedagógico Magistral (ya que 0.99432725 >
0.00453776).
Luego se continúo analizando los casos concretos de Sistemas Tutores Inteligentes que
comparten el dominio de aplicación de esta tesis, como el Meno Tutor de Wolf, el
Proust de Jonhson y el tutor Coach de Selker para determinar el estado de desarrollo de
los mismos. De esta manera quedan establecidos los fundamentos básicos que sustentan
a los distintos tipos de Sistemas Tutores Inteligentes, así como también el modelo
tripartito de módulos propuesto por Carbonell y extensamente utilizado en el ámbito de
los STI.
De esta manera quedan determinados los componentes necesarios para guiar a los
estudiantes en el proceso de aprendizaje, respondiendo a sus necesidades inmediatas y a
largo plazo de la manera más conveniente dados los recursos del sistema.
Se modelaron las partes por separado y se las integro dentro de la arquitectura planteada
de Sistema Tutor Inteligente, utilizando en el caso del submódulo de protocolos
pedagógicos las herramientas que brinda la Inteligencia Artificial (IA) para modelar el
comportamiento del sistema como un tutor humano. Se utilizaron redes neuronales y
demostraron, en el paso posterior de la validación del modelo, de ser aptas para la tarea
propuesta, clasificando a los distintos estudiantes de una manera satisfactoria y
funcionando como el pilar del módulo para la selección del protocolo pedagógico que
más se adapta a las necesidades del estudiante usuario.
Al validar el modelo con los datos reales, tanto para la triangulación de datos como para
el entrenamiento de las redes neuronales que soportan el modelo, se encontró que los
datos se adaptan muy satisfactoriamente a las condiciones de prueba, transformándose
así, no solo en una herramienta teórica valida para guiar a los estudiantes en el proceso
de aprendizaje, sino también en un instrumento practico, que permite implantaciones de
un Sistema Tutor Inteligente capaz de generar resultados satisfactorios mesurables y
útiles en un entorno real.
De esta manera queda cumplido el objetivo general, ya que para el modelo planteado, se
ha validado que es capaz de adaptarse a las necesidades y preferencias de los alumnos,
según sus estilos de aprendizaje. Además, cumple con la condición de ser un
instrumento adicional para realizar tutorizado “uno a uno” entre el estudiante y el tutor
virtual.
Con el objetivo del trabajo cumplido, se provee al campo de los Sistemas Tutores
Inteligentes de una nueva herramienta, para facilitar la selección del protocolo
pedagógico adecuado, redundando esto en una ganancia, no solo para el desempeño del
STI en si mismo, sino en el estudiante, que es el componente humano fundamental que
hace útil al sistema y le brinda identidad. Así se pretende realizar un aporte y mejorar el
desempeño académico de los distintos estudiantes y por ende su calidad de vida.
Los estudiantes mayoritarios desaprobados (75%) son recatalogados, tanto por la red
neuronal S.O.M. como por la Backpropagation, como pertenecientes a otro protocolo
pedagógico que difiere del utilizado en las clases tomadas.
Respuesta 2: Con 120 planillas y 120 juegos de notas, se puede obtener de una
población de 800 un error de generalización menor al 3%.
Pregunta 3: ¿En cuántos grupos o familias pueden organizarse los datos relevados?
¿Es este número aceptable para una relación lineal con los distintos
protocolos pedagógicos?.
Respuesta 3: Se pueden organizar en 2 grupos y este número esta dentro del rango de
los protocolos pedagógicos predichos por la Teoría Uno. Estos grupos
presentan características similares
1. Edad
2. Sexo
3. Carrera
Pregunta 6: ¿Cada uno de los grupos o familias en las que los estudiantes se agrupan
pueden ser relacionadas con un protocolo específico? Y si la respuesta es
afirmativa, ¿Con que protocolo están relacionadas?.
Respuesta 6: Existe una forma de relacionar las familias generadas con las redes
neuronales S.O.M. y el protocolo pedagógico, utilizando las dos
hipótesis siguientes:
Respuesta 8: Utiliza las nuevas tecnologías, sobre todo las de los ambientes
distribuidos, así como también las tecnologías que propone la
Inteligencia Artificial (IA).
Pregunta 9: ¿Qué impacto global tiene la propuesta dentro del marco especifico de los
Sistemas Tutores Inteligentes (STI)?.
A su vez, esto puede que quede fuera del campo de acción de los Sistemas Tutores
Inteligentes clásicos, para ingresar en el terreno de los Asesores Inteligentes, ya que el
sistema no “tutoriza” directamente al estudiante, sino más bien que “acompaña” en un
proceso de descubrimiento donde no existe un objetivo determinado, pero si existe la
necesidad de “guiar” o “asistir” al estudiante en este proceso de descubrimiento para
que rinda buenos resultados.
Por lo tanto una de las futuras líneas de investigación, para ampliar el desarrollo de este
trabajo es la de adaptar las ideas aquí planteadas a otras estructuras similares a la de los
Sistemas Tutores Inteligentes (STI), como pueden serlo los Asesores Inteligentes o
mismos Sistemas Tutores Inteligentes que no poseen un modelo de interacción
tradicional. De aquí también se desprende que las mismas ideas pueden ser adaptadas a
modelos en los que no se aplica el marco de referencia tripartito planteado por
Carbonell, adaptando y redistribuyendo los submódulos que desempeñan las tareas del
tutor a las nuevas estructuras, que, si bien difieren de la estructura clásica, deberán
seguir cumpliendo las mismas funciones y logrando los mismos objetivos.
chemistry. In Meltzer, B., Michie, D., and Swann, M., editors, Machine
Intelligence 4, p. 209-254. Edinburgh University Press, Edinburgh, Scotland.
Burton, R. R.; Brown, J. S. (1981). An investigation of computer coaching for informal
learning activities. In: Sleeman, D., Brown, J. (eds.): Intelligent Tutoring Systems,
Capitulo 4, p. 79-98, London: Academic Press.
Carbonell, J. R. (1970). AI in CAI: An artificial intelligence approach to computer
assisted instruction. IEEE transaction on Man Machine System. Volumen 11
número 4, p. 190-202.
Carpenter, G. A.; Grossberg, S.; Markuzon, N.; Reynolds, J.H.; Rosen, D.B. (1992).
Fuzzy ARTMAP: A neural network architecture for incremental supervised
learning of analog multidimensional maps. IEEE Transactions on Neural
Networks, 3, 698-713.
Carpenter, G. A.; Grossberg, S.; Reynolds, J.H. (1991). ARTMAP: Supervised real-time
learning and classification of nonstationary data by a self-organizing neural
network. Neural Networks, 4, 565-588.
Castillo, E.; Gutiérrez, J. M.; Hadi A. S. (1998). Sistemas Expertos y Modelos de Redes
Probabilísticas. Monografías de la Academia Española de Ingeniería, Madrid.
Cataldi, Z. (2004). Metodología para el diseño y evaluación de sistemas tutores
inteligentes. FI-UNLP. CAPIS. ITBA.
Cataldi, Z.; Figueroa, N.; Lage, F.; Denazis, J. (2003). Analysis of the interactions
between students taking part in problem based learning experiences using
software for groupware in an initial course of computer science engineering
career. Full Paper Aceptado en FIE 2003. 35th ASEE/IEEE Frontiers in
Education Conference. 5-8 de noviembre. Colorado.
Cheeseman, P. (1985). In defense of probability. In Proceedings of the Ninth
International Joint Conference on Artificial Intelligence (IJCAI-85), p. 1002-1009,
Los Angeles, California. Morgan Kaufmann.
Cho, B. (2000). Dynamic Planning Models to Support Curriculum Planning and
Multiple Tutoring Protocols in Intelligent Tutoring Systems. Ph.D. tesis, Illinois
Institute of Technology.
Clancey, W. J. (1991). Intelligent tutoring systems: A tutorial survey, en Applied
Artificial Intelligence: A Sourcebook. McGraw-Hill.
D.A.R.P.A. (1988). Neural Network Study. Defense advanced research projects agency
http://darpa.mil, AFCEA international press. p. 60. Consultado el 15/06/05
Dickinson, C. J.; Goldsmith, C. H.; Sackett, D. L. (1973). J. Clin. Computing, vol. 2, p.
42-50.
Duda, R. O.; Gaschnig, J. G.; Hart, P. E. (1980). Model Design in the Prospector
Consultant System for Mineral Exploration. En Michie, D., editor, Expert Systems
in the Microelectronic Age. Edinburgh University Press, Edinburgh, p. 153–167.
El Sheikh, E.; Sticklen, J. (1998). A Framework for Developing Intelligent Tutoring
Systems Incorporating Reusability. IEA-98-AIE: 11th International Conference on
Industrial and Engineering Applications of Artificial Intelligence and Expert
Systems, Benicassim, Castellon, España, Springer-Verlag (Lecture Notes in
Artificial Intelligence, vol. 1415).
Evens, M. W.; Spitkovsky, J.; Boyle, P.; Michael, J.; Rovick, A. A. (1993). Synthesizing
tutorial Dialogues. Preoceedings of the 15th Annual Conference of the Cognitive
Science Society.
Evens, M. W.; Stefan, B.; Ru-Charn, C.; Freedman; Glass, M; Hee Lee, Y.; Leem Seop,
Shim; Woo Woo, C.; Yuemei, Z.; Yujian, Z,; Joel, A. M.; Rovick, A. A. (2001).
CIRCSIM-Tutor: An Intelligent Tutoring System Using Natural Language
Dialogue. Twelfth Midwest AI and Cognitive Science Conference, MAICS 2001,
Oxford, OH, p. 16-23.
Fausett, L. (1994). Fundamentals of Neural Networks, Englewood Cliffs, NJ: Prentice
Hall.
Felder, R. M.; Baker-Ward, L. (1990). How engenieering students learn, how
engineering professor teach, and what goes wrong in the process. proceedings
ofthe 1990 frontiers in education conferenca, p 82-84.
Felder, R.; Soloman, B. (1998). Learning styles and strategies. Consultado el 21 de
junio de 2004 en www.2.ncsu.edu/unity/lockers/users/f/felder/ .
Feng-Jen, Y. (2001). Turn planning for Dialogue-Based Intelligent tutoring systems.
PhD tesis de PhD. Illinois Institute of Technology. Chicago Illinois.
Fernández, C. T.; Lima, M. D. De Alecar; Zuanásbar, D.; Adeche H. M. (2000)
ambiente de apoyo del desenvolvimiento de cursos hipermedia en la web. SBIE
2000- Simposio brasilero de informática educativa.Maceio, Halagaos. Anales. p.
24-31.
Fernández, I. (1989) Estrategias de Enseñanza en un Sistema Inteligente de Enseñanza
Asistida por Ordenador. Tesis Doctoral (Tercer Ciclo) de la Universidad del País
Vasco, San Sebastián.
Figueroa, N.; Cataldi Z.;Lage F. J.; Salgueiro F. A.; Costa G.; Rendón J. (2004). Nuevos
enfoques para el estudio del desgranamiento universitario. CAEDI 2004: IV
Congreso Argentino de enseñanza de Ingeniería. 1, 2 y 3 de Septiembre, ITBA,
Buenos Aires.
Figueroa, N.; Lage, F.; Cataldi, Z.; Denazis, J. (2003). Evaluación de las experiencias
para mejoramiento del proceso de aprendizaje en asignatura inicial de la carrera
ingeniería informática. International Conference on Engineering and Computer
Education, ICECE 2003, paper 804. 16-19 de Marzo San Paulo.
Freeva, R.; Evens, M. (1996). Generating and revising multi-turn text plans in STI.
Evens. Lecture Notes in Computer Science. Pp 632-640.
Friedberg, R. M..; Dunham, B.; North, T. (1959). A learning machine: Part II. IBM
Journal of Research and Development, 3(3):282-287.
Fukushima, K. (1975). Cognitron: a self-organizing multilayered neural network.
Biological Cybernetics, 20:121 - 136.
Fukushima, K. (1988). Neocognitron: A hierarchical neural network capable of visual
pattern recognition. Neural Networks, 1, p. 119-130.
García, M. (1995). El paradigma de Pensamiento del profesor. Editorial CEAC,
Barcelona.
García-Martínez, R. (1997). Sistemas Autónomos. Aprendizaje Automático. Editorial
Nueva Librería.
Hume G., Michael, J; Rovick, A.; Evens, M. (1997). The Use of Hints by Human and
Computer Tutors: The Consequences of the Tutoring . Illinois Institute of
Technology.
Hume, G. D. (1995). Using Student Modelling to Determine When and How to Hint in
an Intelligent Tutoring System Ph.D., Illinois Institute of Technology.
Hume, G.; Evens, M. (1992) Student modeling and the classification of errors
cardiovascular intelligent tutoring system. Proceedings of the 4th Midwest
Artificial Intelligence and Cognitive Science Society Conference, Utica, IL.
Hunt, E. B. (1975). Artificial Intelligence. New York. Academic Press, EE.UU.
Iglesias, C. A.; Garijo, C.; González, J. (2001). Metodologías orientadas a agentes.
Inteligencia Artificial. Revista Iberoamericana de Inteligencia Artificial. Número
6, Volumen 2. p. 12-23.
Jang, J. S. R.; Sun, C. T.; Mizutani, E. (1997). Neuro-fuzzy and Soft Computing.
Prentice-Hall, 1997, page 184.
Johnson, W. L. (1986). Intention-based diagnosis of novice programming errors.
Morgan-Kauffman.
Kawasaki, E. I.; Imar, N.; Fernández, C. T. (2000). Un modelo de sistema de tutoría
inteligente basado en principios pedagógicos para educación de adultos. En SBIE
2000: Simposio brasilero de informática educativa. Maceio, Halagaos. Anales. p.
154-159.
Keefe, J. (1988). Aprendiendo Perfiles de Aprendizaje. Asociación. Nacional de
Escuelas Secundarias.
Kim, J. H. (1989). CIRCSIM-Tutor: An Intelligent Tutoring System for Circulatory
Physiology. Ph.D. tesis, Illinois Institute of Technology.
Kim, J. H. (2000) Natural Language Analysis and Generation for Tutorial Dialogue.
Ph.D. tesis, Illinois Institute of Technology.
Kinshuk, D. (1996). Effectiveness of Intelligent Tutoring Tools Interfaces in relation to
Student, Learning Topic and Curriculum Characteristics. Tesis de doctorado en
De Montfort University, Leicester, Inglaterra.
Klopf, A. H. (1986). A drive-reinforcement model of single neuron function. InDenker,
J. S., editor, neural networks for computing: AIP Conf. Proc. Volume 151. New
York: American Institute of Physics.
Kohonen, T. (1988). Self-Organizing Maps Springer Series in Information Sciences.
Vol. 30, Springer, Berlin, Heidelberg, NY. P. 236.
Kohonen, T. (2001). Self-Organizing Maps, third edition. Springer series in information
sciences. Ed Springer.Helsinki University of Technology Neural etworks Research
Centre. P. 286-310. Pitman, London.
Konzen, A. A. (1995) Uma estratégia de ensino híbrida para sistemas tutores
inteligentes. En: Simposio Brasilero de Informática en Educación, 1995,
Florianópolis, Brasil. Imprensa Universitária da Universidade Federal de Santa
Catarina, p.327–338.
Kosko, B. (1988). Bidirectional associative memory. IEEE Trans. Syst., Man, Cybern.,
vol. 18, p. 49–60.
Krishnamoorthy, C. S.; Rajeev, S. (1996). Artificial Intelligence and Expert Systems for
Engineers. CRC Press, CRC Press LLC.
Laird, J. E., Newell, A., and Rosenbloom, P. S. (1987). SOAR: an architecture for
general intelligence. Artificial Intelligence, 33(1): 1-64.
Last, M.; Oded, M. (1998) A Compact and Accurate Model for Classification .
Department of Information Systems Engineering, Ben-Gurion University of the
Negev, Beer-Sheva 84105, Israel.
Lighthill, J. (1973). Artificial intelligence: A general survey. In Lighthill, J., Sutherland,
N. S., Needham, R. M., Longuet-Higgins, H. C., and Michie, D., editors, Artificial
Intelligence: A Paper Symposium. Science Research Council of Great Britain,
London.
Madoz, C; DeGiusti, A. (1997) Vinculacion de un curso interactuvi multimedial.
Congreso Argentino de Ciencias de la Computación. CACIC97. La Plata. UNLP.
Maturana, H. (1998) Da Biologia à Psicologia Artmed Editora Ltda..
Minsky, M. (1974). A Framework for Representing Knowledge. MIT-AI Laboratory
Memo 306. Reimpreso en The Psychology of Computer Vision, P. Winston,
McGraw-Hill, 1975. versión corta en J. Haugeland, Mind Design, MIT Press,
1981, and in Cognitive Science, Collins, Allan and Edward E. Smith. Morgan-
Kaufmann, 1992.
Minsky, M. L. (1954). Neural Nets and the Brain-Model Problem (SNARC). PhD thesis,
Princeton University.
Myers, I., Briggs, K. (1962) The Myers-Briggs Type Indicator, Princeton Educational
testing Services.
Nakabayashi, K., Maruyama, M., Kato, Y., Touhei, H., & Fukuhara, Y. (1997).
Architecture of an Intelligent Tutoring System on the WWW, in: B.D. Boulay and
R. Mizoguchi (Eds.), Proceedings of AI-ED'97, World Conference on Artificial
Intelligence in Education, Kobe, Japan, 18–22 August 1997. IOS, Amsterdam,
1997, pp. 39–46.
Narendra, K. S.; Thathachar, M. A. (1974). Learning Automata: A Survey. IEEE
Transactions on Systems, Man, and Cybernetics, vol. 14, p. 323-334.
Newell, A. (1969). Heuristic programming, in Ill-Structured Problems in Progress in
Operations Research. Ed. I. S. Aronofsky, John Wiley and Sons, New York.
Nilson, N. (1995). Principles of Artificial Intelligence. Nils Nilson Editors.
Nilson, N. (2001) Inteligencia Artificial. Una nueva síntesis. Mc Graw-Hill
Interamericana de España.
Oates, T. D. J. (1997). The Effects of Training Set Size on Decision Tree Complexity.
Proc. 14th International Conference on Machine Learning
Oates, Tim, David Jensen. (1998). Large Datasets lead to overly complex models: an
explanation and a solution. Experimental Knowledge Systems laboratory.
Department of computer Science. University of Massachusetts. Amherst, MA
01003-4610
Patel, A.; Kinshuk. (1996). Knowledge Characteristics: Reconsidering the design of
Intelligent Tutoring Systems. CAL Software Engineering & Research Centre 8.1-
8.3, Bosworth House, De Montfort University The Gateway, Leicester LE1 9BH
Phone/Fax: (44) 116 257 7193.
Perkins, D. (1995) La escuela inteligente. Gedisa.
Piaget, J.(1989). La construcción de lo real en el niño. Crítica. Grijalbo.
Platon (2001), la Republica. Ed Tecnos. Reimpresion 2001.
Quinlan, J. R. (1987). Simplifying Decision Trees. Simplifying Decision Trees.
International Journal of Man-Machine Studies 27(3): 221-234.
Quinlan, J. R. 1993. C4.5: Programs for Machine Learning. Morgan Kaufmann.
Rosenblatt, F. (1958), The perceptron: A probabilistic model for information storage
and organization in the brain. Psychological Review, 65, p. 386-408.
Rovick, A.; Brenner L. (1983). HEARTSIM: A Cardiovascular Simulation with Didactic
Feedback. The Physiologist, vol. 26 no. 4, p. 236-239.
Rovick, A.; Michael J. (1986). CIRCSIM: IBM-PC Computer Teaching Exercise on
Blood Pressure Regulation. Proceedings XXX Congress of International Union of
Physiological Sciences, Vancouver, Canada. p. 138.
Rumelhart, D. E.; Hinton, G. E.; Williams, R. J. (1986). Learning internal
representations by back-propagating errors in Parallel Distributed Processing:
Explorations in the Microstructure of Cognition. Eds. Cambridge, MA: MIT
Press, vol. 1, p. 318-362.
Russell,S.J. y Norvig P. (2003). Artificial Intelligence: A Modern Approach (2nd
Edition). Prentice Hall.
Sejnowski, T. J. (1977). Storing covariance with nonlinearly interactingneurons.
Journal of Mathematical Biology, 4 (4), 303–321.
Self, J. (1998). The defining characteristics of intelligent tutoring systems research:
STIs care, precisely. Computer Based Learning Unit University of Leeds, Leeds
LS2 9JT, England. Luego publicado en el International Journal of Artificial
intelligence in education (1999), Leeds, England.
Selker, T. (1989). Cognitive Adaptive Computer Help (COACH). 4th Intl. Conference
on AI and Education, Elsevier Science Publishers.
Seu, Jai, Ru-Charn Chang, Jun Li, Evens, M.; Michael, J. and Rovick, a. (1991).
Language Differences in Face-to-Face and Keyboard-to-Keyboard tutoring
Session. Proceedings of the Cognitive Science Society.
Shah, F. (1997). Recognizing and Responding to Student Plans in an Intelligent
Tutoring System: CIRCSIM-Tutor Ph.D. tesis, Illinois Institute of Technology.
Sierra, E., Hossian, A. y García Martínez, R. (2001). Selección de Estrategias
Instruccionales. Abordaje desde la Teoría del Conocimiento. Revista del Instituto
Tecnológico de Buenos Aires. Volumen 25. Páginas 24-36.
Sierra, E.; García-Martínez, R.; Cataldi, Z.; Britos, P.; Hossian, A.(2003). Sistemas
Tutoriales Inteligentes Centrados en Reparación de Mecanismos. Una Propuesta
Metodológica de Diseño. Revista Latinoamericana de Tecnología Educativa.
Volumen 1 N° 1. Páginas 19-30. Facultad de Educación. Universidad de
Extremadura.
Information Systems (June 6-8, 2002, Gdańsk, Poland), Gdansk, Poland. paginas
1422-1429.
Zeve C. M. D.; Sloczinski H.; Polonia E.; Nitz-Ke J. A.; Lima J. V. (2000) Aprendizaje
colaborativo: la utilización de cd-rom e Internet en un sistema integrado. En
SBIE 2000: Simposio brasilero de informática educativa.Maceio, Halagaos.
Anales. p. 66-72.
Zurada, J. M. (1992). Introduction to Artificial Neural Systems. West Publishing
Company.
Estas planillas fueron relevadas durante los años 2004-2005 para las materias de
Programación Básica de la Facultad de Ingeniería de la Universidad de Buenos Aires
tomando una muestra representativa a fin de trabajar con un error de generalización se
encontrara por debajo de valores aceptables, del padrón total de estudiantes
matriculados en el área. En este caso el error de generalización es menor al 5%.
En esta sección se muestran los resultados obtenidos a partir de los datos de los estilos
de aprendizaje. Se muestran por separado los datos obtenidos para los alumnos de la
materia Computación (75.01) y para la materia Algoritmos y Programación I (75.40)
ambas del área de Programación Básica. Los datos se presentarán en grupos de 4
preguntas para facilitar su lectura.
En la sección A.2.1.- Datos obtenidos para la materia Computación se pueden ver los
valores resultantes de las planillas para la materia Computación (75.01), mientras que
cada uno de los once grupos de preguntas se pueden ver en las Tablas A.1 hasta A.11.
Tabla A.11: Undécimo grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje,
con los datos de la carrera, el sexo y la edad del estudiante.
Como se mencionó en la sección 2.2.4 – Redes Self Organizing Maps (S.O.M.), los
datos de entrada para las redes neuronales del tipo Self Organizing Maps (S.O.M.) sólo
pueden ser numéricos, tanto reales como enteros. A continuación se presentan los datos
de la sección A.2- Planillas de estilos de Aprendizaje, pero esta vez se los muestra
codificados como se usaron para entrenar la red. La codificación de estos datos puede
encontrarse en la sección 5.2.2 –Codificación de los Datos Relevados del Capitulo 5. En
la Tabla A.23 se muestran los datos relevados codificados para las 121 planillas, sin
discriminar la materia a la que pertenecen (aunque esta discriminación se puede realizar
fácilmente utilizando el atributo carrera).
Grupo Grupo Grupo Grupo Grupo Grupo Grupo Grupo Grupo Grupo Grupo
1 2 3 4 5 6 7 8 9 10 11
Carrera
Edad
Sexo
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1 20 0 0 1 0 1 2 0 2 0 0 0 0 0 0 0 0 1 1 0 0 0 2 1 0 0 0 1 2 1 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0
2 20 0 0 1 0 1 1 0 0 1 0 1 2 0 0 0 0 0 1 0 0 0 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 0 1 0 0 0 0 0 0 0
3 20 0 0 1 1 1 0 1 0 1 0 0 0 0 1 1 0 0 1 1 1 0 1 0 0 1 0 1 1 1 1 0 0 0 1 0 1 1 1 0 1 0 1 1 0 0
4 21 0 0 0 0 1 0 1 1 0 1 1 1 0 1 1 0 1 0 1 0 0 1 0 0 0 0 1 1 1 0 0 1 1 0 0 1 0 0 0 0 0 0 0 0 1
5 20 1 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 1 1 0
4 24 0 0 1 1 0 0 1 0 0 0 0 1 0 1 1 1 0 1 1 1 0 1 0 1 0 1 1 1 0 1 0 1 1 0 0 1 0 0 0 0 0 0 1 1 0
4 23 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 1 1 0 1 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 1 1 1 0 0 1 1 0 1 0
5 19 1 0 1 0 1 0 0 0 1 0 0 0 1 1 1 0 0 1 0 0 0 0 0 0 0 1 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 19 1 0 1 0 1 0 0 0 1 0 1 1 0 1 1 1 0 1 1 0 0 0 1 0 0 0 1 1 1 1 0 1 0 0 1 1 2 2 2 2 0 1 1 0 1
6 24 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 0 1 1 0 0 0 1 0 1 0 1 1 1 1 0 1 0 0 1 1 1 0 0 0 0 0 1 0 1
4 22 0 0 0 0 0 1 0 1 1 0 0 0 0 1 1 0 1 1 1 0 0 0 1 0 1 0 1 0 1 1 0 1 0 0 1 1 1 1 0 0 0 0 0 0 1
1 21 0 0 1 2 0 0 0 0 1 1 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0 1 1 0 1
4 20 0 0 1 0 0 0 1 0 0 0 1 0 1 1 0 1 1 1 0 0 1 1 0 1 0 1 0 0 0 1 0 0 1 0 1 1 0 0 0 1 1 1 0 1
5 18 0 1 0 0 1 1 1 1 1 0 1 0 0 1 1 1 1 1 0 0 1 1 1 0 1 1 1 0 1 1 1 1 0 1 1 0 1 0 1 1 0 1 0 0 1
5 29 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 1 1 0 0 0 1 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
4 19 0 0 0 1 1 0 0 1 1 0 0 1 0 1 1 0 1 1 0 1 0 1 0 0 0 1 0 1 1 0 0 0 1 1 0 1 1 1 0 0 0 1 1 0 0
5 18 0 0 0 0 1 0 1 0 0 0 1 0 1 0 1 0 1 0 2 0 0 1 1 0 1 0 0 0 1 1 0 0 0 1 0 0 0 0 0 1 1 1 1 0 0
4 19 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 1 0 0 0 0 1 1 0 1 0 1 0 1 1 1 1 0 0 1 1 0 0 0
4 20 0 0 0 0 1 1 1 1 0 0 1 0 0 1 0 0 1 1 0 1 0 1 0 1 0 0 0 0 1 1 1 1 0 0 1 1 1 1 0 1 0 1 1 0 0
4 20 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 0 0 0 1 0 0
4 19 0 1 0 0 0 1 1 1 0 0 1 1 0 0 1 0 0 1 1 1 0 0 0 1 1 0 1 1 1 0 1 1 0 0 1 1 1 0 1 0 0 0 0 0 0
1 19 0 0 0 0 1 0 0 0 1 0 1 0 0 1 1 0 1 1 1 0 1 1 0 1 0 0 1 0 1 1 1 1 0 1 1 1 1 1 0 1 0 1 1 0 0
1 19 0 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0
1 20 0 0 0 0 0 0 0 0 0 0 2 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 1 0 1
5 21 0 0 0 1 1 1 0 1 0 0 0 1 0 1 0 0 0 1 0 1 0 1 0 1 0 1 1 1 1 1 0 0 1 0 1 1 0 1 0 1 0 0 1 1 0
1 21 0 1 0 0 1 1 1 1 1 0 1 0 1 1 1 1 1 1 1 0 0 1 0 0 0 0 1 0 1 0 0 2 1 1 0 0 1 1 2 0 0 0 0 0 0
4 20 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 1 1 1 1 1 0 1 0 1 1 1 0 0 0 0 0 1 0 1
4 21 0 0 1 0 1 1 0 1 1 0 0 1 0 0 1 0 1 1 1 0 0 1 0 0 0 0 1 0 0 1 0 1 1 0 1 1 1 0 1 1 1 0 1 0 1
5 19 1 0 0 0 1 0 1 1 1 0 1 0 0 1 1 0 0 1 1 0 0 1 0 0 0 0 1 1 1 0 0 1 0 0 1 1 0 0 0 1 1 0 1 1 1
5 21 0 1 1 1 1 1 0 1 0 0 1 1 0 1 1 1 0 1 1 1 0 1 1 0 0 0 1 1 0 1 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0
4 22 0 0 0 0 0 1 0 1 0 0 1 0 1 1 0 0 0 0 1 0 0 1 0 1 0 0 0 2 1 0 0 1 1 1 0 1 1 0 0 0 0 1 0 0 0
1 22 0 0 0 0 1 1 0 1 0 0 1 2 0 1 1 1 0 1 0 0 0 1 0 1 0 0 1 0 1 0 0 0 1 1 0 1 0 1 0 2 0 0 0 0 1
4 19 0 0 1 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0
1 22 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 1 1 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0
4 20 0 0 0 0 1 1 1 0 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0 0 1 0 0 1 1 0 0 0 0 0 0 0
4 21 0 1 1 0 1 0 0 0 1 0 0 0 1 1 1 1 1 1 0 0 1 0 1 0 1 1 1 1 1 0 1 0 0 1 1 1 0 1 0 1 1 0 0 0 0
3 19 0 1 1 0 1 1 0 0 1 1 1 1 0 1 1 1 1 1 1 0 0 1 0 0 0 1 1 1 1 0 0 1 1 1 1 1 0 1 1 1 1 0 0 0 0
4 19 0 0 0 0 1 1 0 0 0 1 0 0 0 1 1 0 0 1 0 0 0 0 1 0 1 1 1 0 1 1 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0
1 20 0 0 0 1 0 1 0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0
4 21 0 0 0 1 0 1 0 1 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 1 0 1 1 1 0 0 1 0 1 0 0 0 0 0 0 0
7 20 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 1 1 0 0 0 0
4 21 0 0 0 0 1 1 0 0 1 0 1 0 0 1 1 0 0 1 0 0 0 1 0 0 0 1 0 1 1 1 0 0 0 1 0 1 0 0 1 0 1 0 1 0 0
5 22 1 0 1 0 0 0 1 1 1 0 1 0 0 0 1 1 0 1 1 0 0 0 1 0 1 0 1 0 1 1 0 0 0 1 1 0 1 0 0 1 0 0 0 0 1
5 18 1 0 1 0 0 0 1 0 0 1 1 1 1 1 0 1 0 1 1 0 0 1 1 1 1 1 0 1 0 0 0 1 0 0 1 1 0 1 1 0 1 0 0 1 0
4 19 0 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 1 0 0 0 0 1 0 0 0 0
4 20 0 0 0 0 1 0 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 1 1 0 0 0 1 1 0 0 1 1 0 0 0 0 1 0 0
4 19 0 2 0 0 1 1 0 0 1 0 1 0 0 1 1 0 1 1 0 1 1 1 0 0 1 0 1 1 1 1 0 0 1 1 0 0 0 0 0 2 1 0 1 0 1
4 20 0 2 2 2 1 2 0 0 2 2 2 0 0 1 1 2 1 1 2 2 2 2 0 1 0 1 1 2 1 0 2 0 2 1 2 2 1 2 0 1 2 2 1 0 0
4 21 1 0 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 0 0 2 1 0 0 2 1 0 1 1 1 0 1 0 0 1 1 1 1 0 0 1 0 0 1 0 1
4 21 0 0 1 0 1 0 0 0 1 0 1 0 2 0 0 0 0 1 0 0 0 0 2 0 0 0 1 0 1 0 2 0 1 0 1 0 0 0 0 0 1 0 1 0 0
5 20 1 0 0 0 1 1 0 1 1 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 1 1 1 0 0 0 1 0 1 0 0 0 0 0
3 27 0 0 0 0 1 1 0 1 1 1 0 0 0 1 1 0 1 1 1 0 0 0 0 0 0 1 1 0 1 1 0 1 0 0 1 1 1 0 0 2 0 1 0 0 0
5 20 1 1 0 0 1 0 0 1 1 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 1 0 1 0 0 0 1 1 0 0 0 0 1 0 0
5 20 0 1 0 2 1 1 1 1 1 1 1 1 0 1 1 1 0 0 2 1 0 0 1 0 1 1 1 1 1 0 1 1 0 0 2 1 1 1 2 1 2 0 1 0 0
5 18 0 0 0 0 1 0 0 1 1 0 1 0 0 1 1 1 1 1 0 1 1 0 1 1 0 1 1 0 1 0 1 0 1 1 1 0 1 0 0 0 0 0 1 0 1
3 23 0 0 0 0 1 1 1 0 1 1 1 0 0 1 0 0 0 1 1 0 0 1 0 0 0 1 1 1 1 1 0 1 1 0 0 1 0 1 1 0 0 1 0 1 0
5 19 1 0 0 0 1 0 0 1 1 0 0 1 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 1 1 1 0 1 0 0 0 1 0 0 1 1 0
4 21 1 0 0 0 1 1 0 0 1 0 0 0 0 1 1 0 1 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 1 1 1 1 0 1 0 0 0 0 1 1 0
3 23 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 1 0 0 0 1 1 1 1 1 0 0 0 1 0 0 0 0
8 20 0 0 1 0 1 1 0 1 1 0 1 0 0 1 0 1 0 1 0 0 0 0 0 0 0 0 1 0 1 1 1 0 1 0 0 1 1 0 0 0 1 0 0 0 0
1 20 0 1 0 0 1 0 1 1 1 0 0 1 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 1 1 0 1 1 1 1 0 0 0 1 1 0 0 0
3 24 0 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 1 0 0 0 1 0 1 0 1 0 0 0 1 1 1 1 0 0 1 0 0 0 1
3 20 0 0 1 1 0 0 0 0 1 1 0 0 0 1 1 0 0 1 0 0 0 1 0 0 0 1 1 0 1 1 0 0 1 0 1 1 1 1 0 0 1 1 0 1 0
5 21 1 0 1 0 1 0 0 0 1 0 1 0 0 1 1 0 0 1 1 2 0 2 1 0 0 1 1 0 1 1 0 0 0 0 1 1 0 0 0 1 1 0 0 1 0
5 20 1 1 0 0 1 1 0 0 1 0 2 0 0 0 1 2 1 1 0 2 0 2 2 0 0 0 2 2 1 2 1 2 0 0 1 0 1 1 0 2 0 0 1 0 1
6 29 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 0 0 0 1 0 0 0 0 1 1 1 1 0 1 1 1 0 1 0 1 0 1 0 0 0 0 0
3 23 0 0 1 0 1 1 0 0 1 1 0 0 0 1 2 0 2 0 0 0 1 1 1 0 0 0 0 0 1 0 1 0 0 0 1 2 1 1 2 1 1 0 0 0 1
7 24 0 0 0 1 0 0 0 0 0 0 1 1 1 1 1 0 1 1 0 0 1 1 0 0 0 0 1 0 1 0 0 0 1 1 1 0 1 1 2 1 0 1 0 0 0
2 20 0 1 0 0 1 1 0 1 1 0 1 0 0 1 1 0 1 1 1 0 0 1 0 0 0 1 0 1 1 1 0 0 1 1 0 1 0 1 0 0 0 1 0 0 1
2 22 0 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 1 1 0 0 1 0 1 0 1 0 1 0 1 0 1 0 1 1 1 0 1 0 0 0 0 0 1 0 1
4 20 0 2 0 0 1 2 0 0 1 0 0 2 0 1 0 0 1 1 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 1 0 0 1 1 0 1 1 0 1 0 1
3 24 0 1 2 0 1 1 1 0 1 0 1 0 0 1 1 0 1 1 1 0 0 1 0 0 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 1 0 2 0 0 0
5 18 0 0 1 0 1 1 0 0 0 0 0 0 1 1 1 0 0 1 1 0 0 1 1 0 1 0 1 0 1 1 1 1 1 0 1 1 0 1 1 1 1 0 1 1 0
8 20 1 0 1 0 1 2 0 0 1 0 1 0 0 0 0 2 1 1 0 1 0 0 1 1 0 1 0 1 1 0 1 1 1 0 0 1 1 1 0 0 1 0 0 1 0
0 20 0 0 0 0 1 1 1 0 0 1 1 1 1 1 0 1 0 1 0 0 0 0 0 1 0 1 1 0 1 0 1 0 0 1 0 0 1 1 0 0 0 0 0 0 0
0 19 0 0 0 1 0 1 0 1 0 0 0 0 0 0 1 1 0 1 0 0 0 1 0 1 0 1 0 0 0 1 0 1 0 1 0 1 0 1 0 0 1 1 0 1 0
0 20 0 0 1 1 1 0 0 1 1 0 0 1 1 1 1 1 1 1 1 1 0 0 1 0 1 0 1 1 1 1 0 0 0 0 1 1 0 0 1 0 1 1 1 1 0
0 19 0 0 0 0 1 1 0 1 1 0 0 0 1 1 1 1 0 1 0 0 0 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 0 0 1 0 1 1 0 1
9 22 1 0 0 0 0 0 1 1 1 0 0 0 1 1 0 0 0 1 1 1 1 0 1 1 0 1 0 0 0 1 0 1 0 1 1 1 0 1 0 1 0 1 0 0 0
0 20 1 0 0 0 1 0 0 0 1 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1 1 1 0 0 0 0 1 0 0
0 19 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 1 0 0
9 19 0 0 0 0 1 0 0 1 0 2 0 1 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 1 1 1 1 0 0 0 0 0 1 0 0 0 0
0 20 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
0 19 0 0 1 0 0 0 0 1 0 0 1 0 0 1 0 0 1 1 0 0 0 1 1 0 1 1 0 0 0 1 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0
9 19 0 0 0 1 0 1 0 1 0 0 0 0 0 0 0 1 2 1 1 0 0 1 0 1 0 0 2 1 0 1 1 1 0 1 0 1 1 1 2 0 1 1 1 0 0
0 18 0 0 1 0 0 1 1 0 0 0 0 1 0 1 1 0 0 1 0 1 0 1 0 0 0 0 1 1 0 0 0 0 1 0 1 1 0 1 1 1 0 1 0 0 1
0 19 0 0 1 0 1 1 1 0 1 0 1 0 0 1 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0 1 1 0 0 1 1 0 0 1 1 1 0 1 0 1 1
0 20 0 0 1 0 1 1 1 0 1 0 1 1 0 1 0 0 1 1 0 0 0 1 1 0 0 1 1 2 1 1 1 0 1 1 1 1 1 2 1 0 0 1 1 0 0
0 20 0 1 0 0 1 1 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 1 1 1 0 0 1 1 0 1 0 1 0 0 0 1 0 0 0
0 18 0 0 0 1 2 1 1 1 1 1 0 0 0 1 0 1 1 1 0 0 0 1 0 0 0 1 0 0 1 0 1 0 1 0 0 0 0 1 2 0 0 0 0 1 0
0 18 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 1 1 0 0 1 1 0 0 1 1 1 0 1 0 0 1 1 1 1 1 0 1 0 0 1 0 0
0 20 0 0 2 1 1 1 1 1 1 1 0 0 1 1 1 0 1 0 2 0 2 1 0 0 0 2 1 0 1 2 2 1 0 1 0 2 0 1 1 0 0 0 1 0 0
9 20 0 0 1 1 0 0 0 1 1 0 0 1 0 1 1 1 0 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 0 1 1 1 1 0 0 0 1 0 0 0
9 25 1 0 1 0 1 0 1 0 1 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 1 0 1 1 1 0 0 1 1 0 1 1 1 1 0 0 1 0 0
9 21 0 1 1 0 1 1 0 0 1 0 1 0 1 0 0 1 0 1 0 0 0 0 1 0 0 1 1 1 1 0 0 0 0 1 1 0 1 0 1 0 1 0 0 0 1
0 19 1 1 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 1 0 1 1 1 0 1 0 1 1 1 0 0 0 0 1 0 0 0
9 28 1 1 1 0 1 0 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 1 0 0 1 1 0 1 1 0 1 0 0 1 1 0
0 20 0 0 1 1 1 1 0 0 1 0 1 0 0 1 0 1 1 1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 1
9 19 0 0 0 0 1 1 0 1 1 0 0 1 0 1 1 1 0 1 0 0 0 1 1 0 0 0 0 0 1 0 0 1 1 0 0 0 1 1 0 0 0 1 0 1 1
0 18 1 0 0 0 1 1 0 0 1 0 0 0 0 1 1 0 0 1 0 0 2 2 2 2 2 2 2 2 1 0 1 1 1 1 0 1 1 1 0 0 1 1 1 0 0
0 21 0 0 0 0 1 1 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 1 0 0 0 0 1 1 1 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0
0 19 1 1 1 0 1 0 0 1 1 0 1 1 0 0 1 1 0 1 0 1 0 0 0 0 0 1 1 1 1 1 0 1 1 0 1 1 0 1 1 0 0 1 0 0 0
0 19 0 0 0 0 1 1 0 0 2 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 1 0 1 1 0 1 0 0 0 1 0 1 0 0 0
0 21 0 0 1 0 0 1 0 0 0 0 1 0 0 1 1 0 1 1 0 0 0 1 1 0 1 1 0 0 1 0 1 0 1 0 0 0 0 0 0 0 1 1 0 0 0
0 19 0 1 0 0 1 1 0 1 1 1 1 1 1 1 1 0 1 0 0 0 0 1 0 0 1 0 1 0 1 1 0 1 1 1 0 0 1 1 0 0 0 1 0 0 1
9 20 1 0 1 0 1 0 1 0 1 0 0 0 0 1 1 0 1 1 0 0 1 0 0 0 1 1 1 1 1 0 0 0 1 1 1 0 1 1 1 0 1 1 0 0 0
0 18 1 0 1 0 0 1 0 0 0 0 0 1 0 0 1 2 0 1 0 0 0 1 0 0 0 1 1 1 1 1 0 1 1 1 0 1 0 0 0 0 1 0 0 0 0
9 19 0 0 0 1 1 1 0 0 0 1 0 1 0 1 1 0 0 1 0 0 0 1 0 0 0 0 0 1 1 0 0 0 1 1 0 1 0 1 0 1 1 1 0 0 0
9 21 0 0 1 0 1 1 1 1 0 0 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 1 0 1 1 0 1 0 1 1 0 1 0 1 1 2 0 0 1 0 1
0 19 0 0 1 0 1 1 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 1 1 0 0 0 0 0 0 1 0 1 0 0 0 1 1 1 0
0 21 0 0 1 0 0 1 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0 1 1 0 0 0 0
0 19 1 1 1 1 1 0 1 1 0 0 0 1 0 1 1 0 0 1 0 0 0 1 0 0 0 1 1 1 1 1 0 1 1 1 1 1 0 1 1 0 0 1 0 0 0
0 20 0 0 1 0 1 1 0 0 1 0 1 0 0 1 1 0 0 1 1 1 0 0 1 0 0 0 1 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 1 0 0
0 20 0 0 0 0 1 0 0 0 1 1 0 0 1 0 1 0 0 0 0 0 0 1 0 0 1 0 1 1 0 1 0 0 0 1 0 1 0 1 0 0 1 0 1 0 1
0 21 0 0 1 0 1 1 0 0 0 0 0 0 0 1 1 0 1 1 1 0 0 1 1 0 0 1 1 0 1 1 1 0 0 1 0 0 1 1 0 0 0 0 1 1 0
0 20 1 0 1 0 1 1 0 0 0 0 0 0 1 1 1 0 0 1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 1 1 0 1 0 1 0 0 1 1 0 0 0
0 20 0 0 0 1 1 1 0 1 0 0 1 1 0 0 1 0 1 1 1 0 0 1 1 0 0 0 1 0 1 0 0 1 1 0 1 0 1 1 0 1 0 0 0 0 0
0 19 0 1 0 0 1 1 0 1 1 0 1 0 0 1 1 0 0 0 0 0 0 0 1 1 0 1 0 0 1 0 1 0 1 0 1 1 0 0 0 0 1 0 1 0 0
0 19 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 1 1 0 0 0 1 0 1 0 0 1 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0
0 19 1 1 1 0 1 0 1 0 1 1 0 0 0 1 1 0 1 1 1 0 0 1 1 0 0 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 0 1 0 0
9 19 0 1 0 0 1 1 1 0 1 1 1 0 0 1 0 0 0 1 1 0 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 1 1 1 1 0 1 0 0 0
Tabla A.23: Datos codificados de las 121 instancias relevadas de la planilla de estilos de aprendizaje. La
codificación utilizada se puede ver en la sección 5.3.1 Codificación del Capítulo 5.
Luego del aprendizaje automático realizado por la red S.O.M. con los datos presentados
en la sección A.3.1.- Datos Codificados de este Anexo, se presentan nuevamente los
juegos de datos en las entradas de la red S.O.M. para que ésta los clasifique en familias
o clusters de acuerdo a la información adquirida durante el periodo de entrenamiento
automático. Como el proceso de aprendizaje es del tipo “Winner takes All” sólo se
activará una neurona de salida, correspondiente a un cluster para cada juego de datos
presentado a la entrada de la red, por lo tanto, cada observación será categorizada con
un solo cluster según la red S.O.M. entrenada.
Los juegos de datos que se utilizan para entrenar la red son procesados con el atributo
edad y sin éste. La clasificación resultante de aplicar las redes S.O.M. se encuentra, para
los primeros se en la Tabla A.26 de la sección A.3.3.1.- Observaciones Clasificadas
(Red entrenada con el atributo Edad), mientras que para los segundos se encuentran en
la Tabla A.27 de la sección A.3.3.2.- Observaciones Clasificadas (Red entrenada sin el
atributo Edad).
Se presentan a continuación las 121 observaciones clasificadas por la red S.O.M. una
vez entrenada con los parámetros óptimos.
48 2 108 3
49 3 109 3
50 3 110 3
51 3 111 3
52 3 112 3
53 3 113 3
54 2 114 3
55 3 115 3
56 3 116 3
57 3 117 3
58 3 118 3
59 3 119 3
60 3 120 3
121 3
Tabla A.26: Resultado de aplicar las redes neuronales S.O.M. a los datos de entrada
Los valores medios de los distintos clusters discriminados por atributos se pueden ver
en la Tabla A.24, para los datos con todos los atributos, en la sección A.3.4.1.- Valores
Medios de los Clusters discriminados por atributos, mientras que los valores medios
para los clusters resultantes de los juegos de datos que no utilizaron todos los atributos
pueden verse en la Tabla A.25 de la misma sección. Las varianzas de los distintos
clusters discriminados por atributos se pueden ver en la Tabla A.26 donde la notación
que identifica a una pregunta determinada es “P” para denominar a las preguntas (que
van de 1 a 4 por grupo) y “G” para denominar al grupo (existen 11 grupos de cuatro
preguntas en las planillas de estilos de aprendizaje). Por lo tanto P1G1 será la pregunta
número uno del primer grupo de preguntas.
Tabla A.25: Valor medio de los 2 clusters generados para cada uno de los 47
valores recogidos por medio de la planilla de estilos de aprendizaje.
Nodo 0
Distribución de la Clase
Elemento Valor
Tipo Rama
Numero de registros 234 cluster 2
Clase Mayoritaria 3 6%
Observaciones totales (%) 100.00%
Observaciones mal 5.98%
clasificadas (%)
Nodo 1
Distribución de la Clase
Elemento Valor
Tipo Hoja cluster 2
Numero de registros 84 0%
Clase Mayoritaria 35.9%
Observaciones totales (%) 3
Observaciones mal 0.00%
clasificadas (%)
Distribución de la clase
cluster 3
100%
Cluster Proporción
2 0.00%
3 100.00% cluster 2 cluster 3
Nodo 2
Distribución de la Clase
Elemento Valor
Tipo Hoja
Numero de registros 144 cluster 2
Clase Mayoritaria 61.54% 6%
Observaciones totales (%) 3
Observaciones mal 5.56%
clasificadas (%)
Nodo 3
Distribución de la Clase
Elemento Valor
Tipo Hoja
Numero de registros 6 cluster 3
0%
Clase Mayoritaria 2.56%
Observaciones totales (%) 2
Observaciones mal 0.00%
clasificadas (%)
Distribución de la clase
cluster 2
Cluster Proporción 100%
2 100.00%
3 0.00% cluster 2 cluster 3
Nodo 4
Distribución de la Clase
Elemento Valor
Tipo Rama
Numero de registros 84 cluster 2
Clase Mayoritaria 35.90% 5%
Observaciones totales (%) 3
Observaciones mal 4.76%
clasificadas (%)
Nodo 5
Distribución de la Clase
Elemento Valor
Tipo Hoja cluster 2
Numero de registros 56 0%
Clase Mayoritaria 23.93%
Observaciones totales (%) 3
Observaciones mal 0.00%
clasificadas (%)
Distribución de la clase
cluster 3
100%
Cluster Proporción
2 0.00%
3 100.00% cluster 2 cluster 3
Nodo 6
Distribución de la Clase
Elemento Valor
Tipo Rama
Numero de registros 4 cluster 3
0%
Clase Mayoritaria 1.71%
Observaciones totales (%) 2
Observaciones mal 0.00%
clasificadas (%)
Distribución de la clase
cluster 2
Cluster Proporción 100%
2 100.00%
3 0.00% cluster 2 cluster 3
Nodo 7
Distribución de la Clase
Elemento Valor
Tipo Hoja cluster 2
Numero de Registros 68 0%
Observaciones totales (%) 29.06%
Clase Mayoritaria 3
observaciones mal 0.00%
clasificadas en porcentual
Distribución de la clase
cluster 3
100%
Cluster Proporción
2 0.00%
3 100.00% cluster 2 cluster 3
Nodo 8
Distribución de la Clase
Elemento Valor
Tipo Rama
Numero de registros 14
Clase Mayoritaria 5.98% cluster 2
Observaciones totales (%) 3 14%
Observaciones mal 14.29%
clasificadas (%)
cluster 3
Distribución de la clase 86%
Cluster Proporción
2 14.29%
3 85.71% cluster 2 cluster 3
Nodo 9
Distribución de la Clase
Elemento Valor
Tipo Hoja
Numero de registros 2 cluster 3
0%
Clase Mayoritaria 0.85%
Observaciones totales (%) 3
Observaciones mal 0.00%
clasificadas (%)
Distribución de la clase
cluster 2
Cluster Proporción 100%
2 100.00%
3 0.00% cluster 2 cluster 3
Nodo 10
Distribución de la Clase
Elemento Valor
Tipo Hoja cluster 2
Numero de registros 10 0%
Clase Mayoritaria 4.27%
Observaciones totales (%) 3
Observaciones mal 0.00%
clasificadas (%)
Distribución de la clase
cluster 3
100%
Cluster Proporción
2 0.00%
3 100.00% cluster 2 cluster 3
Nodo 11
Distribución de la Clase
Elemento Valor
Tipo Hoja cluster 2
Numero de registros 2 0%
Clase Mayoritaria 0.85%
Observaciones totales (%) 3
Observaciones mal 0.00%
clasificadas (%)
Distribución de la clase
cluster 3
100%
Cluster Proporción
2 0.00%
3 100.00% cluster 2 cluster 3
Nodo 12
Distribución de la Clase
Elemento Valor
Tipo Hoja
Numero de registros 2 cluster 3
0%
Clase Mayoritaria 0.85%
Observaciones totales (%) 3
Observaciones mal 0.00%
clasificadas (%)
Distribución de la clase
cluster 2
Cluster Proporción 100%
2 100.00%
3 0.00% cluster 2 cluster 3
En la Tabla A.26 se listan los datos utilizados para entrenar la red del tipo
Backpropagation y obtener luego un “score” o “ranking” de los posibles protocolos
pedagógicos.
Socrático 4 1
Socrático 5 2
Socrático 5 3
Socrático 0 4
Socrático 0 5
Magistral 2 6
Magistral 3 7
Magistral 1 8
Magistral 4 9
Magistral 5 10
Magistral 4 11
Magistral 4 12
Magistral 5 13
Magistral 6 14
Magistral 4 15
Magistral 1 16
Magistral 4 17
Magistral 5 18
Magistral 5 19
Magistral 4 20
Magistral 5 21
Magistral 4 22
Magistral 4 23
Magistral 4 24
Magistral 4 25
Magistral 1 26
Magistral 1 27
Magistral 1 28
Magistral 5 29
Magistral 1 30
Magistral 4 31
Magistral 4 32
Magistral 5 33
Magistral 5 34
Magistral 4 35
Magistral 1 36
Magistral 4 37
Magistral 1 38
Magistral 4 39
Magistral 4 40
Magistral 3 41
Magistral 4 42
Magistral 1 43
Magistral 4 44
Magistral 7 45
Magistral 4 46
Magistral 5 47
Magistral 5 48
Magistral 4 49
Magistral 4 50
Magistral 4 51
Magistral 4 52
Magistral 4 53
Magistral 5 54
Magistral 3 55
Magistral 5 56
Magistral 5 57
Magistral 3 58
Magistral 5 59
Magistral 4 60
Magistral 3 61
Magistral 8 62
Magistral 1 63
Magistral 3 64
Magistral 3 65
Magistral 5 66
Magistral 6 67
Magistral 3 68
Magistral 7 69
Magistral 2 70
Magistral 2 71
Magistral 4 72
Magistral 3 73
Magistral 5 74
Magistral 8 75
Magistral 0 76
Magistral 0 77
Magistral 0 78
Magistral 0 79
Magistral 9 80
Magistral 0 81
Magistral 0 82
Magistral 9 83
Magistral 0 84
Magistral 9 85
Magistral 0 86
Magistral 0 87
Magistral 0 88
Magistral 0 89
Magistral 0 90
Magistral 0 91
Magistral 9 92
Magistral 9 93
Magistral 9 94
Magistral 0 95
Magistral 9 96
Magistral 0 97
Magistral 9 98
Magistral 0 99
Magistral 0 100
Magistral 0 101
Magistral 0 102
Magistral 0 103
Magistral 9 104
Magistral 0 105
Magistral 9 106
Magistral 9 107
Magistral 0 108
Magistral 0 109
Magistral 0 110
Magistral 0 111
Magistral 0 112
Magistral 0 113
Magistral 0 114
Magistral 0 115
Magistral 0 116
Magistral 0 117
Socrático 1 118
Tabla A.26: Datos utilizados para el entrenamiento de la red del tipo
Backpropagation.
Se muestran ahora los resultados, con los puntajes obtenidos por las distintas
observaciones relevadas por medio de la planilla de estilos de aprendizaje. En la Tabla
A.27 se pueden ver los resultados obtenidos utilizando la red entrenada, el protocolo
predicho y el puntaje para cada uno de los protocolos disponibles.
Output
Tipo Salida (Salida)
Protocolo Puntaje (2) Puntaje (3)
Obs No. Protocolo Predicho Socrático Magistral
1 2 2 0,72920364 0,28641269
2 2 3 0,00420061 0,99459732
3 2 3 0,00437272 0,99441481
4 2 3 0,00980494 0,98860174
5 2 3 0,00498649 0,99380898
6 2 3 0,07856944 0,91858882
7 3 3 0,00457859 0,99425501
8 3 3 0,00446060 0,99438852
9 3 3 0,01291529 0,98618466
10 3 3 0,00415787 0,99464726
11 3 3 0,00980494 0,98860174
12 3 3 0,00405812 0,99477100
13 3 3 0,00740716 0,99073237
14 3 3 0,01087097 0,98757231
15 3 3 0,0044431 0,99452043
16 3 3 0,00412031 0,99469244
17 3 3 0,01122339 0,98778611
18 3 3 0,00420061 0,99459732
19 3 3 0,0044946 0,99429500
20 3 3 0,00408124 0,99474418
21 3 3 0,00424933 0,99454194
22 3 3 0,00449460 0,99429500
23 3 3 0,00424933 0,99454194
24 3 3 0,00420061 0,99459732
25 3 3 0,00420061 0,99459732
26 3 3 0,00424933 0,99454194
27 3 3 0,01515141 0,98407018
28 3 3 0,01515141 0,98407018
29 3 3 0,01291529 0,98618466
30 3 3 0,00432234 0,99446601
31 3 3 0,01122339 0,98778611
32 3 3 0,00420061 0,99459732
33 3 3 0,00415787 0,99464726
34 3 3 0,01087097 0,98757231
35 3 3 0,00432234 0,99446601
36 3 3 0,00412031 0,99469244
37 3 3 0,00992244 0,98901963
38 3 3 0,00424933 0,99454194
39 3 3 0,00992244 0,98901963
40 3 3 0,00420061 0,99459732
41 3 3 0,00415787 0,99464726
42 3 3 0,0045473 0,99430299
43 3 3 0,00424933 0,99454194
44 3 3 0,01291529 0,98618466
45 3 3 0,00415787 0,99464726
46 3 3 0,00453497 0,99418825
47 3 3 0,00415787 0,99464726
48 3 3 0,00823588 0,99012327
49 3 3 0,01220238 0,98628980
50 3 3 0,00424933 0,99454194
51 3 3 0,00420061 0,99459732
52 3 3 0,00424933 0,99454194
53 3 3 0,00874755 0,98933774
54 3 3 0,00415787 0,99464726
55 3 3 0,00980494 0,98860174
56 3 3 0,00409864 0,99477005
57 3 3 0,00980494 0,98860174
58 3 3 0,00449460 0,99429500
59 3 3 0,00426307 0,99458957
60 3 3 0,01087097 0,98757231
61 3 3 0,00874755 0,98933774
62 3 3 0,00426307 0,99458957
63 3 3 0,00457526 0,99419957
64 3 3 0,01291529 0,98618466
65 3 3 0,00421338 0,99464226
66 3 3 0,0044606 0,99438852
67 3 3 0,00894184 0,98943752
68 3 3 0,00421252 0,99476504
69 3 3 0,00426307 0,99458957
70 3 3 0,00427175 0,99448252
71 3 3 0,00457859 0,99425501
72 3 3 0,00442835 0,99441707
73 3 3 0,00420061 0,99459732
74 3 3 0,00421338 0,99464226
75 3 3 0,00449460 0,99429500
76 3 3 0,01598717 0,98221719
77 3 3 0,00498649 0,99380898
78 3 3 0,00513425 0,99366325
79 3 3 0,00498649 0,99380898
80 3 3 0,00513425 0,99366325
81 3 3 0,01162295 0,98687679
82 3 3 0,04385835 0,95366597
83 3 3 0,00513425 0,99366325
84 3 3 0,00453776 0,99432725
85 3 3 0,00513425 0,99366325
86 3 3 0,00453776 0,99432725
87 3 3 0,00530588 0,99349499
88 3 3 0,00513425 0,99366325
89 3 3 0,00498649 0,99380898
90 3 3 0,00530588 0,99349499
91 3 3 0,00530588 0,99349499
92 3 3 0,00498649 0,99380898
93 3 3 0,00445446 0,99440676
94 3 3 0,00847284 0,98994881
95 3 3 0,00438148 0,99447745
96 3 3 0,05826632 0,93910235
97 3 3 0,00681117 0,99158704
98 3 3 0,00498649 0,99380898
99 3 3 0,00453776 0,99432725
100 3 3 0,00485881 0,99393594
101 3 3 0,05826632 0,93910235
102 3 3 0,00513425 0,99366325
103 3 3 0,00485881 0,99393594
104 3 3 0,00513425 0,99366325
105 3 3 0,01546693 0,98315006
106 3 3 0,07856944 0,91858882
107 3 3 0,00453776 0,99432725
108 3 3 0,00438148 0,99447745
109 3 3 0,00513425 0,99366325
110 3 3 0,00485881 0,99393594
111 3 3 0,05826632 0,93910235
112 3 3 0,00498649 0,99380898
113 3 3 0,00498649 0,99380898
114 3 3 0,00485881 0,99393594
115 3 3 0,04385835 0,95366597
116 3 3 0,00498649 0,99380898
117 3 3 0,00513425 0,99366325
118 3 3 0,00513425 0,99366325
119 3 3 0,05826632 0,93910235
120 3 3 0,00453776 0,99432725
Tabla A.27: Puntajes asignados a los datos de entrenamiento de la red tipo Backpropagation, donde se
detalla la observación, los atributos para dicha observación y el cluster al que pertenece. En las ultimas tres
columnas se encuentran los puntajes asignados a cada una de las familias y el protocolo pedagógico
seleccionado por la red.
Recuperatorio 1
Recuperatorio 2
Primer Parcial
Práctico 1
Práctico 2
Trabajo
Trabajo
Final 1
Final 2
Final 3
Nombre y Apellido
(codificado)31
Nicolás, A. 2 2 5 4 9 7 - -
Pablo Daniel, A. 2 6 4 9 4 - -
Roxana Maribel, A. 2 A 8 4 9 7 - -
Ignacio Pablo, A A 2 5 4 9 5 - -
Lucas Ariel B. 7 - - 4 9 5 - -
German B. 2 2 2 - - - - -
Darío Oscar, B. 2 2 8 4 8 5 - -
Gustavo, Daniel B. A A 4 4 9 5 - -
Domingo, B. 2 2 2 4 8 - - -
Luís Andrés B. 4 - - 4 8 6 - -
Norberto Gabriel C. 2 2 8 4 9 2 7 -
Juan Martín, C. 2 2 5 4 10 4 - -
Claudio Luciano 2 A 4 4 10 2 - -
Rene Carlos, C. 2 4 - 4 9 2 4 -
Mariano Nahuel, C. A 2 6 4 9 9 - -
Fabio, C. 2 4 4 8 4 - - -
Julio Nicolás, C. A A A - - - - -
Fernando Martín, C. 4 - - 4 8 2 4 -
Beatriz Analía 2 2 5 4 8 8 - -
Graciela Natalia, E. L. A A A - - - - -
Maria Eugenia, D 2 2 9 4 8 5 - -
Ramiro Carlos, F 2 2 4 4 8 5 - -
Damián Alejandro, F 2 2 4 4 10 4 - -
Paula Soledad, F. 7 - - 4 8 8 - -
Sebastián Gerardo 2 5 - 4 10 9 - -
Eduardo Federico, F. 2 2 9 4 8 2 2 7
Mari cruz Vanesa 2 2 2 4 8 - - -
Sabrina, G. 4 - - 4 8 8 - -
Damián, G. P. 2 2 8 4 7 7 - -
Gerardo Andrés, G 2 A A 4 8 - - -
Gastón Matías, G. 2 6 - 4 6 2 5 -
31
Para mantener la confidencialidad de los datos, solo se pondrá el nombre del estudiante y la inicial del
apellido, o de los apellidos. Esto no modifica los resultados, ya que éstos se analizan con fines
estadísticos y no personales.
Federico, H. A A 4 4 7 2 7 -
Gabriel Matías, H. 2 7 - 4 9 2 8 -
Lucila, H. 2 2 2 - - - - -
Herman Matas, J. 4 - - 4 8 2 2 4
Mayya, C. 2 2 2 4 8 - - -
Pablo Daniel, L 2 A A 4 8 - - -
Maria Laura, M. 2 2 2 4 8 - - -
Fernando Gabriel, M. 4 - - 4 9 7 - -
Patricio. M. 5 7 - A 10 10 - -
Jimena, M. 2 4 - 4 8 2 2 4
Martín Miguel, M. A 2 4 4 9 1 - -
Maia Raquel, N. 2 A 7 4 8 7 - -
Nahuel Fernando. N. 2 2 2 4 10 - - -
Alejandro Daniel, N. 2 2 7 4 8 2 7
Fernando Ariel, O. 2 2 5 4 9 2 2 2
Teresa, O. A A A - - - - -
Federico Martín, H. 2 A 4 4 9 2 2 4
Sebastián Gastón 2 2 2 4 10 - - -
Nicolás Sebastián, P. 2 2 4 4 7 2 - -
Santiago Pablo, P. 2 4 - 4 9 2 4 -
Federico Andrés, P. 2 4 - 4 9 6 - -
Marianela Elizabeth 9 - - 4 9 2 5 -
Pablo Manuel, Q. A A 2 4 9 - - -
Martín Gabriel, R. M. 2 2 6 4 6 7 - -
Andrés Pablo, R. 2 7 - 4 7 7 - -
Cesar, R. A 2 2 4 9 - - -
Cesar Heriberto, R. C. A 2 6 4 9 2 4 -
Augusto Cesar, R. 2 A 7 4 9 1 2 4
Fernando, R. 2 A 6 4 6 2 6 -
Pablo, S. 2 A 2 4 7 - - -
Leonardo Ariel, S. 2 A 7 4 8 5 - -
Pablo Antonio, S. A A A - - - - -
Miguel Ángel, S. 4 - - 4 4 2 6 -
Nicolás Max., S. 2 A 2 4 9 - - -
Adrián Estaban, S. A 2 4 4 8 4 - -
Mariana Paula, S. A 2 4 4 8 4 - -
Federico Carlos 2 2 4 4 8 4 - -
Esteban Gabriel, T. A 2 7 4 9 4 - -
Martín Ignacio, U. A A 4 4 9 1 6 -
Edwin V. B. 2 2 2 4 8 - - -
Mario Ignacio, W. 8 - - 4 9 2 8 -
Verónica Noemí, z. 2 2 8 4 9 2 8 -
Julián Rolando, z A 2 7 4 9 2 2 2
Martín Andrés, S. A A 5 4 5 7 - -
Cristina, F. A 2 2 4 5 - - -
Federico, A. 2 A A - - - - -
Matías Leones, A. 2 2 6 4 4 2 2 5
Rodrigo Iván, A. 2 4 - 4 4 2 2 2
Ezequiel, A. I. 7 - - 4 7 8 - -
Mauro Sebastián, a. 2 4 - 4 4 2 4 -
Román, B. 2 2 2 4 - - - -
Sergio Omar, B. A A 2 4 - - - -
Pablo, B. 2 6 - 4 5 6 - -
Juana Inés, C. M. 2 4 - 4 2 7 - -
Sebastián Horacio, C. 2 6 - 4 2 2 4 -
Andrés Sebastián, C. 4 - - 4 6 2 4 -
Mauricio Ariel, C. 2 4 - 4 4 2 8 -
Iván Alejandro, C. A A A 4 - - - -
Cristian, C. 2 2 2 4 - - - -
Matías Ezequiel, C 2 2 4 4 6 2 2 2
Maximiliano Pablo, C 6 - - 4 7 5 - -
Ezequiel, Osvaldo 4 - - 4 8 2 4 -
Fernando Antonio, D. 2 7 - 4 4 4 - -
Bárbara, D. 2 2 2 4 - - - -
Yanina Alejandra, F. A A 2 4 - - - -
Nicolás Sebastián, F. 2 4 - 4 5 2 2 5
Marcelo German, f. 2 2 5 4 4 6 - -
Alejandro Manuel, G. A A A 4 - - - -
Marcos Alejandro, G. 2 7 - 4 4 2 6 -
Leonardo Daniel, G. 2 4 - 4 2 - - -
Pablo German, G. 2 2 2 4 - - - -
Hernan, G. 2 8 - 4 6 2 5 -
Jessica Andrea, G 2 2 2 4 7 - - -
Maria Florencia, J. A A A 4 - - - -
Oscar Aníbal, L. 2 2 2 4 - - - -
Daniela Alejandra, L. 2 2 2 4 5 - - -
Carlos, M. 2 2 2 4 - - - -
Pablo Oscar, L. 2 A A 4 - - - -
Gabriel Angel, M. A A A 4 - - - -
Fernando Ezequiel, M. 4 - - 4 7 4 - -
Damián Ariel, M 2 4 - 4 4 2 4 -
Martín Guillermo, M. 2 2 9 4 4 4 - -
Oscar Horacio, N. A A A 4 - - - -
Sebastián Ariel, O 7 - - 4 9 2 7 -
Marín Daniel, O. A 2 4 4 4 2 2 2
Pablo Alejandro P. C. 2 2 2 4 - - - -
Sebastián Leonardo, P 2 2 7 4 5 2 2 2
Emmanuel Eduardo 2 10 - 4 7 7 - -
Pablo Adrián, P. 2 5 - 4 4 - - -
Tabla A.28: Resultados académicos de 121 alumnos pertenecientes a las materias
Algoritmos y Programación I y Computación de la Facultad de Ingeniería de la
Universidad de Buenos Aires.
Trabajo Práctico
Trabajo Práctico
Recuperatorio 1
Recuperatorio 2
Primer Parcial
Protocolo
predicho
Final1
Final2
Final3
Curso
Nombre y Apellido
2
(codificado)
Nicolás, A. 2 2 5 4 9 7 - - A 1
Pablo Daniel, A. 2 6 4 9 4 - - A 2
Roxana Maribel, A. 2 A 8 4 9 7 - - A 2
Ignacio Pablo, A A 2 5 4 9 5 - - A 1
Lucas Ariel B. 7 - - 4 9 5 - - A 1
Darío Oscar, B. 2 2 8 4 8 5 - - A 1
Gustavo, Daniel B. A A 4 4 9 5 - - A 1
Domingo, B. 2 2 2 4 8 - - - A 1
Luís Andrés B. 4 - - 4 8 6 - - A 1
Norberto Gabriel C. 2 2 8 4 9 2 7 - A 1
Juan Martín, C. 2 2 5 4 10 4 - - A 1
Claudio Luciano 2 A 4 4 10 2 - - A 1
Rene Carlos, C. 2 4 - 4 9 2 4 - A 1
Mariano Nahuel, C. A 2 6 4 9 9 - - A 1
Fabio, C. 2 4 4 8 4 - - - A 1
Fernando Martín, C. 4 - - 4 8 2 4 - A 1
Beatriz Analía 2 2 5 4 8 8 - - A 1
Graciela Natalia, E. L. A A A - - - - - A 1
Maria Eugenia, D 2 2 9 4 8 5 - - A 1
Ramiro Carlos, F 2 2 4 4 8 5 - - A 1
Damián Alejandro, F 2 2 4 4 10 4 - - A 1
Paula Soledad, F. 7 - - 4 8 8 - - A 1
Sebastián Gerardo 2 5 - 4 10 9 - - A 1
Eduardo Federico, F. 2 2 9 4 8 2 2 7 A 1
Sabrina, G. 4 - - 4 8 8 - - A 1
Damián, G. P. 2 2 8 4 7 7 - - A 1
Gastón Matías, G. 2 6 - 4 6 2 5 - A 1
Federico, H. A A 4 4 7 2 7 - A 1
Gabriel Matías, H. 2 7 - 4 9 2 8 - A 1
Herman Matas, J. 4 - - 4 8 2 2 4 A 1
Fernando Gabriel, M. 4 - - 4 9 7 - - A 1
Patricio. M. 5 7 - A 10 10 - - A 2
Jimena, M. 2 4 - 4 8 2 2 4 A 1
Martín Miguel, M. A 2 4 4 9 1 - - A 1
Maia Raquel, N. 2 A 7 4 8 7 - - A 1
Nahuel Fernando. N. 2 2 2 4 10 - - - A 1
Alejandro Daniel, N. 2 2 7 4 8 2 7 A 2
Fernando Ariel, O. 2 2 5 4 9 2 2 2 A 1
Teresa, O. A A A - - - - - A 1
Federico Martín, H. 2 A 4 4 9 2 2 4 A 2
Sebastián Gastón 2 2 2 4 10 - - - A 1
Nicolás Sebastián, P. 2 2 4 4 7 2 - - A 1
Santiago Pablo, P. 2 4 - 4 9 2 4 - A 1
Federico Andrés, P. 2 4 - 4 9 6 - - A 1
Marianela Elizabeth 9 - - 4 9 2 5 - A 1
Martín Gabriel, R. M. 2 2 6 4 6 7 - - A 1
Andrés Pablo, R. 2 7 - 4 7 7 - - A 1
Tabla A.29: Resultados académicos y de clasificación de los alumnos pertenecientes al Curso A.
Trabajo Práctico
Recuperatorio 1
Recuperatorio 2
Primer Parcial
Protocolo
predicho
Final1
Final2
Final3
Curso
Nombre y Apellido
1
(codificado)
Cesar, R. A 2 2 4 9 - - - B 1
Cesar Heriberto, R. C. A 2 6 4 9 2 4 - B 1
Augusto Cesar, R. 2 A 7 4 9 1 2 4 B 1
Fernando, R. 2 A 6 4 6 2 6 - B 1
Pablo, S. 2 A 2 4 7 - - - B 1
Leonardo Ariel, S. 2 A 7 4 8 5 - - B 1
Pablo Antonio, S. A A A - - - - - B 1
Miguel Ángel, S. 4 - - 4 4 2 6 - B 2
Nicolás M., S. 2 A 2 4 9 - - - B 1
Adrián Estaban, S. A 2 4 4 8 4 - - B 1
Mariana Paula, S. A 2 4 4 8 4 - - B 1
Federico Carlos 2 2 4 4 8 4 - - B 1
Esteban Gabriel, T. A 2 7 4 9 4 - - B 1
Martín Ignacio, U. A A 4 4 9 1 6 - B 1
Edwin V. B. 2 2 2 4 8 - - - B 1
Mario Ignacio, W. 8 - - 4 9 2 8 - B 1
Verónica Noemí, z. 2 2 8 4 9 2 8 - B 1
Julián Rolando, z A 2 7 4 9 2 2 2 B 1
Martín Andrés, S. A A 5 4 5 7 - - B 1
Cristina, F. A 2 2 4 5 - - - B 1
Federico, A. 2 A A - - - - - B 1
Matías Leones, A. 2 2 6 4 4 2 2 5 B 1
Rodrigo Iván, A. 2 4 - 4 4 2 2 2 B 1
Ezequiel, A. I. 7 - - 4 7 8 - - B 1
Mauro Sebastián, A. 2 4 - 4 4 2 4 - B 1
Román, B. 2 2 2 4 - - - - B 1
Sergio Omar, B. A A 2 4 - - - - B 1
Pablo, B. 2 6 - 4 5 6 - - B 1
Juana Inés, C. M. 2 4 - 4 2 7 - - B 1
Sebastián Horacio, C. 2 6 - 4 2 2 4 - B 1
Andrés Sebastián, C. 4 - - 4 6 2 4 - B 1
Mauricio Ariel, C. 2 4 - 4 4 2 8 - B 1
Iván Alejandro, C. A A A 4 - - - - B 1
Cristian, C. 2 2 2 4 - - - - B 1
Matías Ezequiel, C 2 2 4 4 6 2 2 2 B 1
Maximiliano Pablo, C 6 - - 4 7 5 - - B 1
Ezequiel, Osvaldo 4 - - 4 8 2 4 - B 1
Fernando Antonio, D. 2 7 - 4 4 4 - - B 1
Bárbara, D. 2 2 2 4 - - - - B 1
Yanina Alejandra, F. A A 2 4 - - - - B 1
Nicolás Sebastián, F. 2 4 - 4 5 2 2 5 B 1
Marcelo Germán, f. 2 2 5 4 4 6 - - B 1
Alejandro Manuel, G. A A A 4 - - - - B 1
Marcos Alejandro, G. 2 7 - 4 4 2 6 - B 1
Leonardo Daniel, G. 2 4 - 4 2 - - - B 1
Pablo Germán, G. 2 2 2 4 - - - - B 1
Hernán, G. 2 8 - 4 6 2 5 - B 1
Jessica Andrea, G 2 2 2 4 7 - - - B 1
Maria Florencia, J. A A A 4 - - - - B 1
Oscar Aníbal, L. 2 2 2 4 - - - - B 1
Daniela Alejandra, L. 2 2 2 4 5 - - - B 1
Carlos, M. 2 2 2 4 - - - - B 1
Pablo Oscar, L. 2 A A 4 - - - - B 1
Gabriel Ángel, M. A A A 4 - - - - B 1
Fernando Ezequiel, M. 4 - - 4 7 4 - - B 1
Damián Ariel, M 2 4 - 4 4 2 4 - B 1
Martín Guillermo, M. 2 2 9 4 4 4 - - B 1
Oscar Melchor, N. A A A 4 - - - - B 1
Sebastián Ariel, O 7 - - 4 9 2 7 - B 1
Marín Daniel, O. A 2 4 4 4 2 2 2 B 1
Pablo Alejandro P. C. 2 2 2 4 - - - - B 1
Sebastián Leonardo, P 2 2 7 4 5 2 2 2 B 1
Emmanuel Eduardo 2 10 - 4 7 7 - - B 1
Pablo Adrián, P. 2 5 - 4 4 - - - B 1
Tabla A.30: Resultados académicos y de clasificación de los alumnos pertenecientes al Curso B.