Sistemas Inteligentes para El Modelado Del Tutor

SISTEMAS INTELIGENTES PARA EL
MODELADO DEL TUTOR
TESIS DE GRADO EN INGENIERIA INFORMATICA

FACULTAD DE INGENIERIA
UNIVERSIDAD DE BUENOS AIRES
Tesista: Sr. Fernando A. SALGUEIRO
Director: Prof. Dr. Ramón GARCÍA-MARTÍNEZ
Co-Directora: Prof. M. Ing. Zulma CATALDI
Laboratorio de Sistemas Inteligentes
NOVIEMBRE 2005
SISTEMAS TUTORES INTELIGENTES PARA EL MODELADO DEL TUTOR
Resumen
En las carreras de ingeniería se ha observado, la existencia de grandes dificultades en
los aprendizajes de los estudiantes que se inician en el estudio de un lenguaje de
programación. Esto se evidencia cuando los estudiantes no pueden interpretar los
algoritmos debido a su mala preparación previa y a la falta de metodologías de trabajo,
por lo que requieren de una guía docente continua.
En este contexto, se busca modelar un tutor que permita definir y aplicar una estrategia
pedagógica para la enseñanza de las estructuras básicas de programación. Se pretende
dar los lineamientos que deben regir el comportamiento del tutor para adaptarse a las
necesidades del alumno para que el mismo pueda mejorar su rendimiento en la materia
sobre todo en los cursos muy numerosos.
Palabras clave: Estrategias Pedagógicas, Lenguaje Natural, Modelo del Tutor, Redes
Neuronales, Sistemas Asesores Inteligentes, Sistemas Expertos.
Abstract
It has been observed on the engineering careers, the existence great difficulties in the
learning’s of the students who are been initiating there’s studies of programming
languages. The students cannot interpret the algorithms due to their bad previous
preparation and to the lack of work methodologies, reason why they require of a
continuous educational guide.
In this context, it is intend to model a tutor who allows to define and to apply
pedagogical strategies for the suitable education of the basic structures of programming.
It is intend to give the basic rules that must govern the behavior of the tutor module to
adapt to the necessities of the student so that he can improve its yield in the matter.
Keywords: Pedagogical strategies, Natural Language, Tutor Module, Neural Networks,

Intelligent Advisory Systems, Intelligent Tutoring Systems.
Agradecimientos
En primer lugar quiero expresar mi agradecimiento al Prof. Dr. Ramón García Martínez,
Director del Centro de Ingeniería de Software e Ingeniería del Conocimiento (CAPIS)
del Instituto Tecnológico de Buenos Aires (ITBA) y del Laboratorio de Sistemas
Inteligentes (LSI) de la Facultad de Ingeniería de la Universidad de Buenos Aires
(FIUBA), y director de esta tesis. También a la Prof. M. Ing. Zulma Cataldi, Directora
del Laboratorio de Informática Educativa y Medios Audiovisuales (LIEMA) de la
Facultad de Ingeniería de la Universidad de Buenos Aires (FIUBA) y codirectora de
esta tesis. A ambos, gracias por la confianza depositada en mí desde el inicio de este
trabajo, por los consejos constantes y por la dedicación absoluta, tanto personal como
profesional, para que este trabajo saliera adelante.
Al Prof. M. Ing. Fernando J. Lage, profesor del Departamento de Computación de la

Facultad de Ingeniería de la Universidad de Buenos Aires (FIUBA), por sus sugerencias
para la elaboración de la presente tesis y por su apoyo a lo largo de todos estos años.
A la Universidad de Buenos Aires y a la Facultad de Ingeniería, por su apoyo para

completar mi formación como individuo útil de esta sociedad en la cual disfrute desde
agosto de 1998 hasta la actualidad. Y, en general, a todos los integrantes del
departamento de Computación, en particular a mi amigo y compañero Guido Costa. De
verdad, muchísimas gracias.
A mis padres Celia y Alberto, a quienes les debo todo y es gracias a ellos que estoy
aquí. Sé que esto es muy poco para todos sus sacrificios, pero espero que este trabajo les
devuelva en parte tolo lo que me han dado.
También, a mi hermana Mariana y a mi queridísimo abuelo Adolfo, quienes siempre

fueron fuente de fuerza y alegría para seguir adelante en todos mis proyectos y me
impulsaron para no desistir hasta alcanzar la meta.
Por último, y de manera más especial a Carolina. Muchas gracias por tu amor y apoyo
durante todo este tiempo. Por todo lo que me has aguantado, sabes que esta tesis
también es tuya.
RESUMEN Fernando A. Salgueiro V

Tabla de Contenidos
Resumen III
Abstract III
Agradecimientos IV
Agradecimientos V
Índice de Figuras X
Índice de Tablas XI
Índice de Abreviaturas XIII
Capítulo 1 – Introducción 14
1.1 - Introducción 14
1.2 - Descripción General del Problema 15
1.3 - Carácter del Problema 18
1.4 - Importancia de Encontrar la Solución al Problema 20
1.5 – Metodología de Trabajo 21
1.6 – Limitaciones e Implicancias 22
1.7 - Visión General del Trabajo 23
Capítulo 2 - Estado del Arte 24

2.1 – Introducción 24
2.2 – Inteligencia Artificial 25
2.2.1 – Historia de la Inteligencia Artificial 27
2.2.2 – El Algoritmo Inductivo C4.5 31
2.2.2.1 – Construcción de los Árboles de Decisión 31
2.2.2.2 – Parámetros Para el Análisis de los Árboles de TDIDT 33
2.2.2.3 – La Poda de los Árboles. 34
2.3 – Redes Neuronales 35
2.3.1 – El Modelo Biológico 35
2.3.2 – Redes Neuronales Artificiales (ANN) 36
2.3.2.1 – La Neurona Artificial 37
2.3.2.2 – Aprendizaje de las Redes Neuronales Artificiales 39
2.3.2.3 – Topología de las Redes Neuronales 43
2.2.3 – Redes Backpropagation [Rumelhart et al., 1986] 44
2.2.3.1 – Funcionamiento de las redes Backpropagation 46
2.2.3.2 – Entrenamiento de las redes Backpropagation 47
2.2.4 – Redes Self Organizing Maps (S.O.M.) [Kohonen, 2001] 49
2.2.4.1 – Entrenamiento de las redes S.O.M. 50
2.2.4.2 – Parámetros de las Redes S.O.M. 51
2.2.5 – Campos de Aplicación 53
2.3 – Sistemas Tutores Inteligentes 55
2.3.1 – Arquitectura y Componentes 56
2.3.2 – Módulo del Alumno 57
2.3.2.1 – Estilos de Aprendizaje 58
2.3.2.2 – Planilla de Estilos de Aprendizaje 58
2.3.2.3 – Rendimiento Académico de los Estudiantes 63
2.3.3 – Módulo del Dominio 63
2.3.4 – Interface 64
RESUMEN Fernando A. Salgueiro VII

2.3.5 – Módulos Externos: Evaluación y Registros Históricos 64

2.3.6 – Módulo del Tutor 64
2.3.6.1 – Introducción 64
2.3.6.2 – Técnicas Educativas Generales 67
2.3.6.3 – Teorías de Aprendizaje 68
2.3.6.3 – Técnicas Educativas Aplicables 72
A) La Instrucción Didáctica. 73
B) El Entrenamiento. 74
C) La Enseñanza Socrática. 75
D) Otros Métodos de Enseñanza. 76
2.3.7 – Modelos de Implementación de Sistemas Tutores Inteligentes (STI) 77
2.4 – Trabajos Similares 78
2.4.1 – El Proyecto CircSim 79
2.4.2 – Falencias del CircSim 81
2.4.3 – STI Orientados a la Enseñaza de Lenguajes de Programación. 82
2.4.4 –Falencias de los STI Orientados a la Programación 84
Capítulo 3 - Descripción del Problema 87

3.1 – Definición Detallada del Problema 87
3.2 – Definición de los Objetivos de la Tesis 88
3.2.1 – Objetivo General 88
3.2.2 – Objetivos Específicos 88
3.2.3 – Preguntas de Investigación 89
3.3 – Límites y Restricciones del Trabajo 90
3.4 – Recursos Necesarios. 91
3.4.1 – Recursos tecnológicos 91
3.4.2 – Recursos Bibliográficos 92
3.4.3 – Recursos Humanos 93
Capitulo 4 – Solución Propuesta 94

4.1 – Establecimiento y Justificación de la Solución. 94
4.1.1 – Submódulos e Interfaces 97
4.2 – Análisis de los Submódulos 99
4.2.1 – Submódulo Protocolos Pedagógicos 99
4.2.1.1 – Analizador de Perfil 100
4.2.1.2 – Inferencia del Protocolo Pedagógico 104
4.2.1.3 – Submódulo de Generador de la Lección. 110
4.2.1.4 – Determinación de Objetivos de la Lección. 112
4.2.1.5 – Arquitectura del planeador de la Lección. 114
Capitulo 5 – Resultados Experimentales 115

5.1 – Introducción 115
5.2 –Instrumento de Toma de Datos Aplicado al Dominio 116
5.2.1 –Cálculo del Tamaño Muestral 116
5.2.2 –Codificación de los Datos Relevados. 117
5.3 – Redes S.O.M. y Clusters Resultantes. 119
5.3.1 –Puesta a Punto de las Redes S.O.M. 119
5.3.2 – Resultados de la Aplicación de la Red S.O.M. 121
5.3.3 – Atributos Más Relevantes. 122
5.4 – Inducción, Árboles de Decisión y Reglas 123
VIII Fernando A. Salgueiro RESUMEN

5.4.1 – Inducción Utilizando Atributos con Mayor Ganancia de Información 124

5.4.2 – Comparación de Resultados. 127
5.5 – Inferencia. 129
Capítulo 6 - Conclusiones 133

6.1 – Contribución Realizada a la Solución del Problema. 133
6.1.1 – Respuesta a las Preguntas de Investigación. 134
6.2 – Futuras líneas de investigación 137
Bibliografía 138
Anexo A: Datos Experimentales para el Submódulo Pedagógico 147

A.1 – Introducción 147
A.2 – Planillas de Estilos de Aprendizaje 147
A.2.1 – Datos Obtenidos para la Materia Computación 148
A.2.1.1 – Primer Grupo 148
A.2.1.2 – Segundo Grupo 149
A.2.1.3 – Tercer Grupo 150
A.2.1.4 – Cuarto Grupo 152
A.2.1.5 – Quinto Grupo 153
A.2.1.6 – Sexto Grupo 154
A.2.1.7 – Séptimo Grupo 155
A.2.1.8 – Octavo Grupo 157
A.2.1.9 – Noveno Grupo 158
A.2.1.10 – Décimo Grupo 159
A.2.1.11 – Undécimo Grupo 161
A.2.2 – Datos Obtenidos de la Materia Algoritmos y Programación I 162
A.2.2.1 – Primer Grupo 162
A.2.2.2 – Segundo Grupo 163
A.2.2.3 – Tercer Grupo 164
A.2.2.4 – Cuarto Grupo 165
A.2.2.5 – Quinto Grupo 166
A.2.2.6 – Sexto Grupo 167
A.2.2.7 – Séptimo Grupo 168
A.2.2.8 – Octavo Grupo 169
A.2.2.9 – Noveno Grupo 170
A.2.2.10 – Décimo Grupo 171
A.2.2.11 – Undécimo Grupo 172
A.3 – Valores de Entrenamiento para la Red S.O.M. 173
A.3.1 – Datos Codificados 173
A.3.2 – Clusters Resultantes 175
A.3.3 – Valores Medios y Varianzas de los Clusters Resultantes 177
A.4 – Inducción y Árboles de Decisión. 179
A.4.1 – Análisis del Árbol generado 179
A.5 – Red Backpropagation 184
A.5.1 – Datos de entrenamiento para la red Backpropagation. 184
A.5.2 – “Score” Obtenido por la Red Backpropagation 187
A.6 – Datos de los Cursos de Prueba 190
A.6.1 – Alumnos Clasificados por la Red Backpropagation (Curso A) 193
A.6.2 – Alumnos Clasificados por la Red Backpropagation (Curso B) 194
RESUMEN Fernando A. Salgueiro IX

Índice de Figuras
Capítulo 2 - Estado del Arte
Figura 2.1: Relación entre la IA, la Ingeniería del Conocimiento y otras áreas. 25
Figura 2.2: Esquema de una neurona artificial y una neurona humana. 37
Figura 2.3: Distintas funciones de activación para las neuronas artificiales. 38
Figura 2.4: Modelo de Hopfield de red neuronal artificial. 44
Figura 2.5: Modelo Backpropagation de red neuronal artificial. 46
Figura 2.6: Modelo S.O.M. de red neuronal artificial. 49
Figura 2.7: Impacto de las iteraciones sobre el resultado del entrenamiento. 52
Figura 2.8: Estructura clásica de un Sistema Tutor Inteligente. 57
Figura 2.9: Planilla de estilos de aprendizaje. 62
Figura 2.10: Ejemplo de interacción del sistema CircSim. 82
Figura 2.11: Solución del problema factorial. 82
Capitulo 4 – Solución Propuesta

Figura 4.1: Diferencias entre un STI teórico y su versión implementada. 94
Figura 4.2: Estructura clásica de un Sistema Tutor Inteligente. 98
Figura 4.3: Estructura de un STI, con submódulos y un módulo evaluador. 98
Figura 4.4: Submódulo de Protocolos Pedagógicos 99
Figura 4.5: Conjunto autoorganizado. 101
Figura 4.6: Arquitectura típica de una red neuronal del tipo S.O.M. 101
Figura 4.7: Árbol de decisión generado por el algoritmo C4.5. 103
Figura 4.8: Esquema básico para categorizar los estilos pedagógicos. 104
Figura 4.9: Procesos de clasificación de estudiantes.. 107
Figura 4.10: Esquema general del proceso de inferencia. 107
Figura 4.11: Procedimiento para detectar a los estudiantes mal categorizados. 107
Figura 4.12: Estructura modificada de la solución. 109
Figura 4.13: Dos versiones la estructura de la solución. 109
Figura 4.14: Pasos a seguir luego de la obtención del protocolo pedagógico. 110
Figura 4.15: Selección de objetivos para la sesión pedagógica. 113
Capitulo 5 – Resultados Experimentales

Figura 5.1: Respuestas posibles de los alumnos encuestados. 118
Figura 5.2: Resultado de la clusterización con distinta cantidad de neuronas. 120
Figura 5.3: Valor medio de cada una de las variables normalizadas de S.O.M. 122
Figura 5.4: Esquema del árbol generado por el algoritmo C4.5. 125
X Fernando A. Salgueiro RESUMEN

Índice de Tablas
Tabla 2.1: Comparación entre el cerebro humano y una computadora. 35
Tabla 2.2: Campos de aplicación de las redes neuronales artificiales 54
Tabla 2.3: Topologias de redes e hitos ordenados cronológicamente. 54
Tabla 2.4: Ejemplo de la planilla de resultado de los estudiantes. 63
Tabla 2.5: Características de los STI entre los 70’ y 90’ [Kinshuk, 1996] 67
Tabla 2.6: Paralelismo entre la concepción de Piaget y la de Vigotsky 70
Tabla 2.7: Características de los primeros STI orientados a la programación 86

Tabla 5.1: Etapas fundamentales del diseño experimental. 115
Tabla 5.2: Cupos disponibles para las materias de Programación Básica 116
Tabla 5.3: Codificación de las Carreras para utilizar la red S.O.M. 119
Tabla 5.4: Parámetros utilizados para el entrenamiento de las Redes S.O.M. 120
Tabla 5.5: Resumen de elementos resultantes de aplicar redes S.O.M. 121
Tabla 5.6: Reglas resultantes de recorrer el árbol generado por el Algoritmo C4.5 124
Tabla 5.7: Características de las reglas generadas por el Algoritmo C4.5. 124
Tabla 5.8: Resumen del árbol C4.5 generado. 126
Tabla 5.9: Observación número 121 como fue relevada de la planilla. 127
Tabla 5.10: Resumen del árbol C4.5 generado. 128
Tabla 5.11: Porcentajes obtenidos para el análisis de los estudiantes. 130
Tabla 5.12: Resultados de los datos de entrenamiento de la red Backpropagation. 131
Anexo A: Datos Experimentales para el Submódulo Pedagógico

Tabla A.1: Primer grupo de preguntas relevadas. 149
Tabla A.2: Segundo grupo de preguntas relevadas. 150
Tabla A.3: Tercer grupo de preguntas relevadas. 151
Tabla A.4: Cuarto grupo de preguntas relevadas. 153
Tabla A.5: Quinto grupo de preguntas relevadas. 154
Tabla A.6: Sexto grupo de preguntas relevadas. 155
Tabla A.7: Séptimo grupo de preguntas relevadas. 157
Tabla A.8: Octavo grupo de preguntas relevadas. 158
Tabla A.9: Noveno grupo de preguntas relevadas. 159
Tabla A.10: Décimo grupo de preguntas relevadas. 160
Tabla A.11: Undécimo grupo de preguntas relevadas. 162
Tabla A.12: Primer grupo de preguntas relevadas. 163
Tabla A.13: Segundo grupo de preguntas relevadas. 164
Tabla A.14: Tercer grupo de preguntas relevadas. 164
Tabla A.15: Cuarto grupo de preguntas relevadas. 165
Tabla A.16: Quinto grupo de preguntas relevadas. 166
Tabla A.17: Sexto grupo de preguntas relevadas. 167
Tabla A.18: Séptimo grupo de preguntas relevadas. 168
Tabla A.19: Octavo grupo de preguntas relevadas. 169
Tabla A.20: Noveno grupo de preguntas relevadas. 170
Tabla A.21: Décimo grupo de preguntas relevadas a partir de las planillas de estilos de
aprendizaje, con los datos de la carrera, el sexo y la edad del estudiante. 171
RESUMEN Fernando A. Salgueiro XI

Tabla A.22: Undécimo grupo de preguntas relevadas. 172

Tabla A.23: Datos codificados de las 120 instancias relevadas. 175
Tabla A.26: Resultado de aplicar las redes neuronales S.O.M. a los datos de entrada 177
Tabla A.24: Valor medio de los 2 clusters generados. 178
Tabla A.25: Valor medio de los 2 clusters generados. 179
Tabla A.26: Datos utilizados para el entrenamiento de la red Backpropagation. 186
Tabla A.27: Puntajes asignados por la red tipo Backpropagation. 189
Tabla A.28: Resultados académicos de 121 alumnos. 192
Tabla A.29: Resultados académicos y de clasificación (Curso A). 194
Tabla A.30: Resultados académicos y de clasificación (Curso B). 195
XII Fernando A. Salgueiro RESUMEN

Índice de Abreviaturas
ABAM = Adaptive Bidirectional Associative Memory
AG = Additive Grossberg
ANN = Artificial Neuronal Network.
ART = Adaptative Resonancy Theory
BAM = Bidirectional Associative Memory
CAD = Computer Aided Design
CAE = Computer Aided Engineering
CAI = Computer Assisted Instruction
CIM = Computer Integrated Manufacturing
GA = Genetic Algorithms
HP = Heuristic Programming
IA = Artificial Intelligence
INCO = Ingeniería del Conocimiento
KBES = Knowledge-Based Expert Systems.
KE = Knowledge Engineering.
LCS =Learning Companion Systems.
LMS = Least Mean Squared Error
NSTI = Nuevos Sistemas Tutores Inteligentes
OOP = Object Oriented Programming
SG = Shunting Grossberg
STI = Sistemas Tutores Inteligentes
VLSI = Very Large Scale Integration
RESUMEN Fernando A. Salgueiro XIII

Capítulo 1 – Introducción
1.1 - Introducción
El modelado de los Sistemas Tutores Inteligentes (STI) es una tarea compleja, ya que
implica considerar los módulos básicos de la arquitectura tripartida propuesta por
Carbonell [Carbonell, 1970] que fuera revisada luego por Self [Self, 1998] en forma
integral. A la hora de modelar un STI se deben considerar las características del
dominio (contenido), del comportamiento observable o mensurable del alumno (modelo
del alumno) y del conjunto de estrategias que serán abordadas por el módulo del tutor
en búsqueda de una enseñanza personalizada.
Una de las tareas de la arquitectura de los STI es la sistematización del conocimiento

pedagógico a ser contenida en el módulo del tutor que concierne tanto al modelado
como a la implementación de los STI. Además, surge la necesidad de presentar algunos
mecanismos de apoyo al aprendizaje, en base a aquellas técnicas utilizadas por los
tutores.
La selección del protocolo pedagógico más adecuado como resultado del análisis del
perfil del estudiante es uno de los factores mas influyentes a la hora de obtener buenos
resultados en las distintas sesiones pedagógicas, por lo tanto, se plantea la necesidad de
encontrar técnicas que determinen cuál es el mejor protocolo disponible en el sistema
(es decir, el que se adapte mejor a las necesidades del estudiante) para satisfacer cada
sesión pedagógica programada, teniendo en cuenta el desempeño anterior del estudiante
y otras características intrínsecas del mismo como pueden ser las preferencias del
estudiante y los contenidos a utilizar.
De esta manera, se pueden desarrollar Sistemas Tutores Inteligentes (STI) y Sistemas

Asesores Inteligentes (SAI) capaces de “personalizar la educación” en los distintos
dominios, sin necesidad de una intervención directa de los tutores humanos, para
determinar los objetivos de cada una de las sesiones pedagógicas, así como el protocolo
a utilizar para que la sesión brinde los mejores resultados.
Con la implementación de los Sistemas Tutores Inteligentes (STI) que presenten las
características mencionadas se propone mejorar los rendimientos de los estudiantes en
las materias del área de Programación Básica1.
1
A esta área corresponden las materias Computación: Código 75.01 (para todas las carreras de Ingeniería
a excepción de Ingeniería Electrónica, Informática y Lic. en Análisis de Sistemas) y Algoritmos y
Programación I: Código 75.40 (para las carreras de Ingeniería Informática y Licenciatura en Sistemas) de
la Facultad de Ingeniería de la Universidad de Buenos Aires (FIUBA).
14 Fernando A. Salgueiro INTRODUCCIÓN

1.2 - Descripción General del Problema
Este tema de investigación surge motivado por la necesidad de encontrar diferentes

formas alternativas para la enseñanza de las asignaturas Algoritmos y Programación I
(código 75.40) de la Carrera Ingeniería Informática y Computación (código 75.01) del
resto de las carreras, exceptuando Ingeniería Electrónica.
Durante los últimos seis cuatrimestres se efectuó el seguimiento de los alumnos (a
través de sus evaluaciones parciales y finales integradoras) a fin de saber por qué
algunos no llegaban a aprobar la materia. Si bien la cantidad de alumnos que aprueban
la materia, está en el orden del 30%, existen datos provenientes de Universidades como
La Plata [Madoz et al., 2000] y Tecnológica [Bruno, 2003], en las asignaturas
equivalentes donde se evidencia que la problemática es muy parecida, por lo que
actualmente se encuentran elaborando estrategias tendientes a la paliación del problema.
A lo largo de últimos seis cuatrimestres, se han aplicado diversas estrategias didácticas
usando medios audiovisuales, foros de discusión, grupos de aprendizaje y se ha
observado que si bien se evidencian mejoras, las mismas apuntan a los grupos de
estudiantes que normalmente tienen menores dificultades.
Por este motivo, se pensó en principio, en el desarrollo de un Sistema Tutor Inteligente

(STI) (utilizando Sistemas Inteligentes) que realizase la tarea de tutorizado adaptando
diferentes modalidades o estrategias de enseñanza. Esta podría ser una alternativa útil
sobre todo para aquellos estudiantes que requieren un mayor grado de tutorizado del
tipo uno a uno [Perkins, 1995], es decir personalizado.
Wenger [Wenger, 1978] define la tarea de la enseñanza en términos de una

“comunicación del conocimiento” que involucra a un sistema tutor y a un estudiante
donde el objetivo básico es que el estudiante pueda adquirir conocimiento de alguna
materia. Se busca un sistema de tutorizado que exhiba un comportamiento similar al de
un tutor humano, es decir, que en lugar de ser un modelo rígido se adapte al
comportamiento del estudiante. Éste, debería ser capaz de identificar la forma en cual el
estudiante está resolviendo el problema [Hume, 1995] y de brindarle ayuda cuando
cometa errores [Hume et al., 1996]. A su vez debería proveerle el conocimiento que
requiera para poder solucionar el problema con explicaciones en el momento preciso, y
adicionalmente podría aprender de la interacción con el estudiante.
Se ha observado que los Sistemas Tutores y Asesores Inteligentes disponibles en la

actualidad no han encontrado soluciones eficientes en referencia a la flexibilidad en
cuanto a modalidades de enseñanza, aunque en los 90, con los avances de la psicología
cognitiva [Gardner, 2003], las neurociencias y los nuevos paradigmas de programación,
los sistema facilitadores de la enseñanza evolucionaron desde una propuesta instructiva
hacia entornos de descubrimiento y experimentación del nuevo conocimiento [Bruner,
1990; Perkins, 1995] desde una visión constructivista de los procesos de aprendizaje. Es
decir, se pasa de una postura conductista con base en la teoría de Skinner en otra
centrada en la psicología cognitiva.
En un Sistema Tutor Inteligente (STI), el modelo del tutor es el encargado de definir y

de aplicar una estrategia pedagógica de enseñanza (de tipo socrática, orientador, etc.),
de contener los objetivos a ser alcanzados y los planes utilizados para alcanzarlos. Es el
INTRODUCCIÓN Fernando A. Salgueiro 15

responsable de seleccionar los problemas, de monitorear y de criticar el desempeño, de

proveer asistencia cuando se la requiera y de seleccionar el material de aprendizaje al
estudiante. Integra el conocimiento acerca del método de enseñanza (ya sea deductivo,
inductivo, analógico, analítico, sintético, de trabajo colectivo, etc.), las técnicas
didácticas (expositiva, discusión, demostración, diálogos, instruccional, responder
preguntas, etc.) y del dominio a ser enseñado. Un sistema de este tipo debe tratar
además, los aspectos esenciales del curriculum y de la planificación, ya que los aspectos
de curriculum involucran la representación, la selección y la secuenciación del material
a ser utilizado y la planificación se refiere a cómo ese material va a ser presentado. En
general, tienen una muy buena representación en forma explícita del dominio pero no
siempre el curriculum está dado en forma explícita, es decir desde la visión y la
secuenciación, lo que se obtiene es un bajo rendimiento.
Esta selección y secuenciación del curriculum para los estudiantes requiere del uso de
mecanismos de planificación sofisticados que deben tener en cuenta la teoría de
tutorizado empleada haciendo hincapié en las necesidades del estudiante.
Aún hoy día, la mayoría de los desarrolladores de programas “didácticos” se basan en

modelos instruccionales de corte conductista [Perkins, 1995] para entrenamientos. En
este sentido, la intención de la investigación es emular a un tutor humano, pero
orientado hacia la psicología cognitiva, es decir, teniendo en cuenta como señala
Perkins [Perkins, 1995], los estilos más apropiados de enseñanza tales como la
instrucción didáctica, el entrenamiento y la enseñanza socrática que son compatibles
con su “Teoría Uno”2. Debido a la problemática planteada se piensa en sentar las bases
para un sistema de aprendizaje por refuerzo; ya que justamente el objetivo buscado es
que el estudiante le encuentre significado a sus aprendizajes, que supere sus
dificultades, incorporando lo nuevo de un modo significativo y permanente. [Ausubel et
al. 1983].
El aporte del presente trabajo permitirá esclarecer algunos interrogantes respecto de

cómo enseñan los tutores humanos y podría dar solución a los estudiantes de clases muy
numerosas, que no pueden acceder al docente durante el horario habitual de clases.
Se ha observado que en los cursos universitarios de los primeros cuatrimestres de las

carreras de Ingeniería que la cantidad de tutores humanos no es suficiente, donde la
relación alumnos/docentes es muy alta [Gertner et al., 1998] y que existe una gran
diferencia en el nivel de conocimientos previos que traen los alumnos. [Ausubel et al.,
1983].
Se piensa que un sistema que pueda emular al tutor humano y que además provea al
estudiante de cierta flexibilidad para la elección del tipo de tutorizado más adecuado,
podría ser una solución factible para el problema planteado.
En la literatura analizada se han encontrado dos posturas para la implementación de los

conocimientos: una se basa en la estructura sintáctica de lo producido por los tutores
humanos [Seu Jai et al., 1991] y la otra en las metas pedagógicas que deben cumplir a
2
La Teoría Uno no es un modelo, ni un método de enseñanza, sino un conjunto de recomendaciones
compatibles con cualquier teoría. Ella estipula que “La gente aprende más cuando tiene una oportunidad
razonable y una motivación para hacerlo” [Perkins, 1995].

fin de que el alumno pueda comprender el tema [Hume et al., 1996; Evens et al., 1993].
Pero, analizando a fondo el problema y utilizando ambas teorías en forma conjunta se
podrían lograr una serie de pasos que pueden resumir la forma de impartir los
conocimientos [Freeva et al., 1996]:
· El tutor debe mantener una jerarquía de metas: Que debe cumplir mientras
imparte los conocimientos al alumno (el cual producirá un resultado que el tutor
no puede predecir de antemano).
· El tutor debe poder explicar un mismo concepto de diferentes maneras: Así

si el alumno no entiende el concepto el tutor puede continuar efectuando otro
acercamiento al mismo tema, explicando el concepto para luego continuar,
utilizando un método iterativo para profundizar en el concepto cada vez más
(paso a paso) o para descartar este acercamiento al tema e intentándolo de otra
manera.
En este contexto, surgen las posibilidades de aplicabilidad de los sistemas inteligentes a
la resolución de problemas de modelado de este tipo. En el campo de los Sistemas
Inteligentes se encuentran las Redes Neuronales (RN), que son interconexiones masivas
en paralelo de elementos simples, que responden a una cierta jerarquía intentando
interactuar con los objetos reales tal como lo haría un sistema neuronal psicológico
[Kohonen, 1988]. Las redes neuronales poseen una característica que las hace muy
interesantes, dado que pueden asimilar conocimiento en base a las experiencias
mediante la generalización de casos [García-Martínez et al., 2003].

1.3 - Carácter del Problema
Un tutor inteligente que ayude a mejorar la interacción en el triángulo didáctico:

alumno, docente y contenido a ser aprendido, es un problema netamente práctico que
consiste en agregar un medio tecnológico, por lo que la relación didáctica se convierte
en un tetraedro donde ahora se incluye al “mediador pedagógico” (o medio).
Por otra parte, todas las interacciones entre el alumno y el docente, están enmarcadas en
las teorías de aprendizaje y de enseñanza aplicables a dicha interacción, lo que brinda
un marco teórico al problema citado, donde no solo es importante el conocimiento que
debe ser facilitado por el docente hacia el alumno, sino que cobra importancia la forma
en la que este conocimiento es presentado, ya que se pretende lograr la mayor eficiencia
posible en este proceso de adquisición y construcción de conocimiento. Se busca la
incorporación de los métodos y técnicas de enseñanza más eficaces que permitan
adaptar el modo de enseñanza a las necesidades del alumno a fin de mejorar los
resultados a través de cada clase o “sesión pedagógica” para cualquier dominio. Cada
alumno podrá elegir entonces la técnica de enseñanza que mejor se adapte a su estilo de
aprendizaje.
Si bien no está dentro de los objetivos de este trabajo el desarrollo de nuevos marcos
metodológicos para mejorar la interacción entre el docente y el alumno en el ámbito de
la enseñanza, se busca utilizar modelos y técnicas educativas probadas.
Esta investigación se inscribe dentro de los llamados Sistemas Tutores Inteligentes

(STI) y se trata que todas las consideraciones tomadas para un modelar un tutor
inteligente aplicado al dominio del aprendizaje de Programación Básica puedan ser
utilizadas en otros dominios sin realizar modificaciones importantes en el modelo
planteado. Para ello, es necesario realizar una redefinición de los módulos que
componen un Sistema Tutor Inteligente (STI) y de las interfaces entre estos módulos,
identificando cuáles son los generadores de los datos y cuáles son los que los utilizan.
Aquí se debe realizar un aporte dentro del marco teórico global de los STI para poder
resolver el problema planteado.
Por lo tanto, se tiene un problema que presenta características prácticas y teóricas, las
que de pueden describir como:
· Características Prácticas: Son las que incluyen el desarrollo de los distintos

submódulos del módulo del tutor de un Sistema Tutor Inteligente (STI) que se
adapte a la definiciones previas como la de Carbonell [Carbonell, 1970].
Además se deberán tener en cuenta los métodos de enseñanza más adecuados
para la Programación Básica, así como también los instrumentos para verificar
su validez y confiabilidad.
Se deben poder seleccionar los protocolos pedagógicos más eficientes para cada
sesión pedagógica a fin de impartirla del mejor modo posible con los recursos
didácticos disponibles. Éstos se pueden obtener del módulo del estudiante
(características del estudiante) y del módulo del dominio (que posee la
información concerniente a los conceptos que se utilizarán en la lección, así
como también las imágenes, ejercicios, videos, etc.).

· Características Teóricas: Se deberá redefinir el modelo clásico de los Sistemas

Tutores Inteligentes propuesto por Carbonell [Carbonell, 1970] para detectar en
la superposición de funcionalidad de los módulos básicos, modificando los
subcomponentes de esta estructura para lograr un Sistema Tutor Inteligente
(STI) que sea independiente del dominio.
Se deben incorporar instrumentos para medición de rendimiento académico de

los estudiantes, tales como evaluaciones, cuestionarios y ejercitación que
conviertan al Tutor Inteligente en una herramienta diagnóstica con un valor
educativo que permita mejorar la interacción entre el estudiante y el tutor.
También se deben seleccionar y adecuar las herramientas pertenecientes al

campo de la Inteligencia Artificial que mejor solucionen la problemática
planteada, realizando un análisis de los beneficios y los costos que la
introducción de estas técnicas pueden presentar respecto de las estructuras
clásicas y rediseñadas de los Sistemas Tutores Inteligentes.
De esta manera se resolverá un problema teórico-práctico de carácter interdisciplinario,

basado en un marco teórico educativo y en las herramientas informáticas que aporta la
Inteligencia Artificial (IA) que pueden soportar estas teorías.

1.4 - Importancia de Encontrar la Solución al Problema
A través de Sistemas Tutores Inteligentes (STI) se puede lograr una educación

personalizada3 como un intento de mejorar la calidad de la enseñanza y el acceso a la
educación a los niveles sociales más bajos mejorando finalmente su calidad de vida.
El caso particular de un Sistema Tutor Inteligente (STI) con un dominio de

Programación Básica permitirá a los estudiantes de los cursos iniciales de las carreras de
Ingeniería mejorar su rendimiento y a la vez el rendimiento en las materias más
avanzadas que utilicen la base de conocimientos que debe adquirirse en estas
asignaturas.
Se requiere, por lo tanto, la elaboración de nuevas estrategias tendientes a la atenuación

del problema, pero teniendo en cuenta el presupuesto limitado disponible, la
introducción de un Sistema Tutor Inteligente (STI), adaptable a las necesidades
particulares de cada uno de los estudiantes, es una opción valida, sobre todo en las
Facultades de Ingeniería, que poseen los recursos informáticos básicos necesarios
(como redes internas de computadoras, Hosts con capacidades computacionales
suficientes, etc).
Con la implantación de este tipo de sistemas, se puede disminuir la carga de los

docentes en cursos con altos índices de alumnos/docentes. Así, se personaliza el
ambiente de aprendizaje, sin requerir más recursos humanos y a la vez se pueden
flexibilizar los horarios de estudio para los estudiantes, permitiendo que los alumnos
que trabajan o que viven alejados de los establecimientos educativos puedan interactuar
con el sistema según su propio ritmo de estudios.
No es el objetivo de un Sistema Tutor Inteligente (STI) reemplazar a un tutor humano,

sino que su implementación puede ser útil en situaciones donde se requiere de refuerzos
en la enseñanza. De esta manera se pueden manejar de forma más eficiente los escasos
recursos humanos disponibles, pudiendo el tutor humano hacerse cargo en forma
personalizada sólo de un cierto número de tareas que el sistema no puede realizar, o es
muy complejo de implementar.
Esta perspectiva de la enseñanza tiene al estudiante como el centro del proceso

educativo, siendo éste quien regula sus aprendizajes. De esta manera se mueve el foco
de atención del tutor o profesor y en particular del alumno que, según el modelo clásico,
cumple con una tarea puramente pasiva (la del aprendizaje) modificando esta visión por
la de un estudiante es el centro del modelo, donde son sus necesidades las que deben
prevalecer.
Tomando en cuenta las consideraciones señaladas, el objetivo es un sistema que,

aprovechando los recursos disponibles en la actualidad, permita disminuir las tareas
de los tutores humanos y que a la vez mejore la experiencia de aprendizaje desde la
perspectiva del estudiante.
3
También podría considerarse a distancia.

1.5 – Metodología de Trabajo
Para llevar a cabo esta investigación se requiere de varias etapas metodológicas.
La primera etapa se centra en la revisión de la literatura existente en la temática de:

modelado del tutor, protocolos de enseñanza, Sistemas Tutores Inteligentes (STI) en
general, así como también se relevarán las posibles herramientas que provee la
Inteligencia Artificial (IA) para poder llevar a cabo el modelo planteado. Esta etapa
finaliza con la elaboración de un informe que constituye el Estado del Arte donde se
resumen las investigaciones más relevantes en el tema y el estado actual de las
herramientas, métodos y técnicas disponibles. Aquí se describen también los
fundamentos teóricos que cimentarán la solución elegida a través de la investigación de
libros, revistas especializadas, sitios de Internet de centros de investigación de
universidades nacionales e internacionales y eventos de la temática (Simposios,
Congresos, Jornadas, Workshops, etc.).
La segunda etapa consiste en el diseño y elección de las herramientas de toma de datos

(planillas de estilos de aprendizaje). De acuerdo con Hernández Sampieri [Hernández
Sampieri, 2001] se determinará la validez y confiabilidad de la herramienta utilizada.
Por otra parte, se debe determinar el tamaño muestral adecuado del total de estudiantes
(población en estudio) a fin de trabajar por debajo de una cota de error de
generalización (aproximadamente 5%).
En la tercera etapa se definirá la arquitectura básica del Sistema Tutor Inteligente

(STI) que permita independizar las funciones básicas de los módulos y submódulos que
componen a todo el sistema, evitando la superposición de funcionalidad entre los
distintos módulos.
En la cuarta etapa a partir de los datos tomados mediante el instrumento (planilla de

estilos de aprendizaje) se debe determinar la existencia de las preferencias de los
estudiantes hacia los diferentes protocolos pedagógicos (formas de enseñanza). Con lo
que se validarán las hipótesis y que los estilos de aprendizaje condicionan las formas o
protocolos de enseñanza.
En esta etapa se deben aplicar las herramientas más apropiadas de la Inteligencia

Artificial (IA) para la selección del modo de enseñanza que mejor se adapte para cada
estudiante y se busca el modo de enseñanza más efectivo para cada estudiante. De no
estar presente el mismo en el sistema para un tema dado, se debe prever que el Sistema
Tutor Inteligente (STI) genere una escala o ranking de los métodos de enseñanza
adecuados para que se le pueda recomendar al estudiante.
La quinta etapa consiste en evaluar la solución propuesta a través de una muestra

significativa de estudiantes de Programación Básica utilizando como datos de referencia
sus rendimientos académicos. Finalmente se llevará a cabo el informe final de la tesis,
con las conclusiones, limitaciones encontradas y con las futuras líneas de investigación.

1.6 – Limitaciones e Implicancias
En el desarrollo del modelo propuesto, existen limitaciones debidas a la escasez de

algunos recursos, así como también el acceso a estudiantes de distintas carreras, la falta
de docentes que dicten materias aplicando diferentes de protocolos pedagógicos y la
imposibilidad de obtener observaciones de estudiantes de carreras no relacionadas con
la Ingeniería. Por lo tanto, en esta sección es pertinente generar un listado de las
limitaciones de este trabajo para dejar completamente definido su marco de acción.
El tesista solo obtuvo acceso a estudiantes de carrera de Ingeniería, especialmente a los

de las carreras de Ingeniería Informática y Licenciatura en Análisis de Sistemas, pero
para obtener diversidad de datos y no relevar una población demasiado homogénea, que
puede llevar a errores como overfitting, se relevaron datos de todas las carreras que se
dictan en la facultad, con excepción de Ingeniería Electrónica.
Los protocolos pedagógicos que no se encuentran incluidos en el marco de la Teoría

Uno, no forman parte del análisis de este trabajo. Existen diferentes visiones a la de la
Teoría Uno con respecto a lo métodos de enseñanza, las cuales pueden poseer una
correlación directa con las descriptas por la Teoría Uno, debido a su gran aplicabilidad,
pero puede darse el caso de que diferentes métodos de enseñanza sean aplicados por los
docentes y deberá realizarse una nueva inferencia para relacionarlo con los diferentes
grupos de estudiantes.
Este trabajo no soporta interacciones no guiadas sobre el sistema, es decir, que el

usuario inicie una interacción con el sistema, sin perseguir algún objetivo definido,
como puede ser la explicación de una lección, la aclaración de algún punto específico de
la ejercitación o simplemente la diferenciación de conceptos. El sistema mantiene una
pila de objetivos para determinar si la sesión tiene el rumbo deseado y, en el momento
en el que el último de los objetivos es alcanzado, la finaliza y no soporta las
interacciones que no posean un objetivo específico, ya que no puede determinar cuando
se alcanza un objetivo que no está especificado.
La falta de un análisis detallado de los demás módulos ha obligado a tomar la

funcionalidad de los mismos como la suma de las funcionalidades básicas propuestas
por varios autores. La falta de la definición de interfaces claras entre esos módulos ha
llevado a definir las interfaces básicas entre el módulo del tutor y los demás módulos,
pero no se realiza ningún análisis sobre cómo los datos que se generan en los módulos
externos al del tutor son tratados para ser presentados en la interface, y se supone su
existencia en relación a lo planteado por los diferentes investigadores.

1.7 - Visión General del Trabajo
Esta tesis se compone de las siguientes partes a través de seis capítulos:
1. Introducción
2. Estado del Arte
3. Descripción del Problema
4. Solución
5. Propuesta Resultados
6. Bibliografía
A. Anexos
El objetivo básico de la tesis es redefinir el modelo del tutor para que un Sistema Tutor
Inteligente (STI) buscando establecer una relación entre los estilos de aprendizaje y los
protocolos pedagógicos para ofrecer una solución viable para reducir el alto porcentaje
de desaprobados en las materias de Programación Básica.
En el capítulo 1 se encuentra la introducción al problema que se busca dar una solución,

así como también se define el carácter del mismo. Se establece la metodología de
trabajo que se utilizará para desarrollar la tesis y se resalta la importancia de encontrar
la solución al problema citado.
En el capítulo 2 se define el Estado del Arte, se dan las definiciones teóricas básicas y se
analizan los Sistemas Tutores Inteligentes (STI) en general y el módulo del tutor en
particular (sección 2.3). Se analiza el desempeño de las distintas implementaciones de
los STI realizadas hasta la fecha (sección 2.4), así como también las herramientas de la
Inteligencia Artificial (IA) aplicables.
En el capítulo 3 se presenta el problema y su contexto (sección 3.1), las cuestiones

relativas a la extensión de la arquitectura elegida (sección 3.2), se señalan los objetivos
a cumplir (sección 3.3) así como también las elementos necesarios para llevar a cabo la
misma (sección 3.4).
En el capítulo 4 se propone una solución posible al problema (sección 4.1) y se destaca

el aporte de la misma. Se detalla la metodología utilizada para proceder luego a realizar
las justificaciones necesarias para probar su validez (sección 4.3).
En el capítulo 5 se describen y se analizan los resultados de la solución propuesta

(sección 5.1), y la calidad de la misma con respecto a otras similares (sección 5.4), se
enumeran las dificultades encontradas a lo largo de la búsqueda de la solución.
En el capítulo 6 se presentan las conclusiones del trabajo y se responden las preguntas

de investigación planteadas en capítulo 3. Además, se dejan planeadas las líneas de
investigaciones futuras.
En los Anexos se encuentran las tablas y los juegos de datos utilizados en el capítulo 5
para evaluar la solución propuesta, así como también los datos intermedios obtenidos
antes de la evaluación de la solución.

2.1 – Introducción
Algunas tecnologías como los agentes inteligentes, las redes neuronales, los sistemas
expertos y los Sistemas Tutores Inteligentes, que hace unos años solo existían en forma
teórica o en los ámbitos universitarios, se utilizan a diario en aplicaciones de uso
relativamente sencillo que se encuentran en la etapa de producción y no son solo casos
de estudio en los laboratorios universitarios. Además, estas tecnologías están
disponibles para las grandes empresas y los centros de alta tecnología, así como también
para aplicaciones pequeñas y medianas, que pueden utilizarlas a diario.
En los últimos años las tecnologías han evolucionado muy rápidamente y la Inteligencia
Artificial (IA) surge como una de las ramas de estudio más recientes y promisorias en el
campo de las Ciencias de la Computación. Ello hace que existan muchas aplicaciones
poco exploradas lo cual torna a este campo en un área interesante para los
investigadores, estudiantes y administradores que puedan utilizar en forma directa los
resultados de las investigaciones.
A finales del siglo XIX se realizaron estudios sistemáticos, basados en distintas

ciencias, como la psicología, la educación, la sociología, la medicina, etc., para explicar
el proceso de aprendizaje y el funcionamiento de la mente humana. Se crearon muchas
teorías a partir de estas investigaciones, desde las fisiológicas, que explican el
funcionamiento del cerebro humano en función de intercambio de neuroreceptores y
diferencias de potencial hasta las filosóficas que intentan explicar el funcionamiento del
cerebro humano a partir de los estímulos externos.
Se observa que cada autor da una definición de la inteligencia: desde la enunciación

muy general de Maturama, que la ve como “un tributo o propiedad distintiva de
algunos organismos” [Maturama, 1998], pasando por investigadores como Piaget
[Piaget, 1989] que plantea que la inteligencia “es la capacidad de adaptación de un
organismo a una situación nueva”.
Es aquí donde la investigación sobre Inteligencia Artificial (IA) intenta asimilar estas
definiciones dentro de sus propias estructuras, incorporándolas en los Sistemas Tutores
Inteligentes (STI) que contemplan el aprendizaje humano y como la enseñanza con base
pedagógica. Es por ello, que el objetivo de este capítulo es presentar un marco
conceptual que de lugar al Estado del Arte de la Inteligencia Artificial (AI) y los
Sistemas Tutores Inteligentes (STI).
24 Fernando A. Salgueiro ESTADO DEL ARTE

2.2 – Inteligencia Artificial
A diferencia de la filosofía y la psicología, que tratan de entender cómo funciona la

inteligencia en abstracto, la Inteligencia Artificial (IA) es un intento por descubrir y
aplicar los aspectos de la inteligencia humana que pueden ser simulados mediante
construcciones artificiales. Se observa que hasta en las etapas tempranas de su
desarrollo, la Inteligencia Artificial (IA) ha presentado productos sorprendentes en sus
aplicaciones [Stuart et al., 1995].
Hoy en día, el campo de la Inteligencia Artificial (IA) enmarca varias subáreas tales
como los sistemas expertos, la demostración automática de teoremas, el juego
automático, el reconocimiento de la voz y de patrones, el procesamiento del lenguaje
natural, la visión artificial, la robótica, las redes neuronales, etc [Castillo et al., 1998].
En la Figura 2.1 se pueden ver los subcampos dentro de la Inteligencia Artificial
[García-Martinez et al., 2003].
Inteligencia Artificial
Ingeniería del Conocimiento

Sistemas Basados
en Conocimiento
Expertos
Sistemas
STI
Figura 2.1: Relación entre la IA, la Ingeniería del Conocimiento (INCO) y otras áreas.
[García-Martínez et al., 2003]
La inteligencia artificial (IA) surge así como una disciplina cuyo objetivo es proveer
técnicas para el desarrollo de programas capaces de simular la inteligencia que utilizan
los humanos para solucionar problemas en una gran cantidad de dominios
[Krishnamoorthy et al, 1996], por lo que la IA provee un conjunto de formalismos que
pueden representar los problemas, las herramientas y técnicas para resolverlos. Según
diversos autores [Krishnamoorthy et al, 1996; Newell, 1969] las actividades esenciales
asociadas con la inteligencia son:
· Responder de manera flexible a una gran variedad de situaciones.
· Dar sentido a los mensajes contradictorios y/o ambiguos.
ESTADO DEL ARTE Fernando A. Salgueiro 25

· Reconocer la importancia relativa de los diferentes elementos de la situación

problemática planteada.
· Encontrar similitudes entre situaciones, sin importar las diferencias que las
separan.
· Encontrar las diferencias entre situaciones, sin importar lo similares que puedan
parecer.
Por su amplio contenido, es difícil definir a la Inteligencia Artificial (IA), pero resulta
de interés para este trabajo arribar a un concepto esclarecedor, por lo que se expondrán
diferentes posiciones acerca de la IA.
Si bien existen muchas definiciones de Inteligencia Artificial (IA) en las que cada autor
la presenta de una manera ligeramente diferente, aquí se resumirán las más
representativas, agrupadas como lo propone Stuart [Stuart et al., 1995] en dos
categorías:
· Las que conciernen a los procesos de pensamiento y razonamiento.
· Las que conciernen al comportamiento
En general, estas definiciones miden el éxito de la implementación de herramientas de

la Inteligencia Artificial (IA) de dos maneras diferentes:
· En términos de performance humana: Es decir, capacidad de resolución de

problemas, capacidad de razonamiento abstracto, etc.
· En términos de “racionalidad” o concepto ideal de inteligencia: Como

establece Stuart [Stuart et al., 1995] quien define a un sistema como racional “si
hace lo correcto”, es decir, una acción a la que llega por medio de procesos
lógicos mesurables.
Aclaradas las posibles distinciones en las definiciones, se las enumerará

cronológicamente:
Bellman en 1978 la definió como: “La automatización de las actividades que

asociamos con el pensamiento humano, actividades como la toma de decisiones, la
solución de problemas y el aprendizaje”. Esta definición también es aplicada por
Villareal Goulat [Villareal Goulat, 2001].
Haugeland en 1985 la definió como: “El nuevo y excitante esfuerzo de hacer pensar a
las computadoras”…”computadoras con mente, en el sentido completo y literal de la
frase”.
Según Charniak y McDermott en 1985 es: “El estudio de las facultades mentales a
través del uso de modelos computacionales”.

Para Kurzweil en 1990 es: “El arte de crear máquinas que realicen funciones que
requieran una cierta inteligencia cuando estas tareas son desempeñadas por
personas”.
Schalkoff en 1990 la definió como: “Un campo de estudio que busca explicar y emular
el comportamiento inteligente en términos de procesos computacionales”.
Para Rich y Knight en 1991 es: “El estudio para hacer a las computadoras realizar
tareas, en las que por el momento los humanos son mejores”.
Según Winston en 1992 es: “El estudio de la computación para hacer posible el
percibir, razonar y actuar”.
Luger y Stubblefield en 1993 la definieron como: “La rama de la ciencia de la

computación que se encarga de la automatización del comportamiento inteligente”.
Por último, se considera a los dos pioneros de la investigación en Inteligencia Artificial,

Barr y Feigenbaum, quienes la definen de la siguiente manera: “La Inteligencia
Artificial es la parte de la Ciencia que se ocupa del diseño de sistemas de computación
inteligentes, es decir, sistemas que exhiben las características que asociamos a la
inteligencia en el comportamiento humano que se refiere a la comprensión del
lenguaje, el aprendizaje, el razonamiento, la resolución de problemas, etc.” [Barr et al.,
1981].
Todas estas definiciones mencionadas son válidas y cada una agrega un aspecto al
amplio campo de estudio que es la Inteligencia Artificial (IA).
2.2.1 – Historia de la Inteligencia Artificial
En este apartado se presenta una reseña histórica de la investigación en el campo de la

Inteligencia Artificial (IA) cronológicamente ordenados de manera de obtener un
panorama general de su evolución. Esta evolución permitirá observar como van
surgiendo las nuevas herramientas y aplicaciones que facilitarán los diseños de los
Sistemas Tutores Inteligentes (STI).
Stuart [Stuart et al., 1995] reconoce que los primeros trabajos en Inteligencia Artificial
fueron realizados por Culloch y Pitts en 1943, quienes centraron sus investigaciones en
tres áreas fundamentales:
· El conocimiento de la fisiología y las funciones básicas de las neuronas.
· El análisis formal de la lógica proposicional
· La teoría de computación de Turing.
Ellos propusieron la primera simulación de una neurona que funcionaba como un

interruptor (encendido/apagado) con respecto al valor de las neuronas vecinas. Seis años
después, en 1949 Hebb [Hebb, 1949] creó una regla simple para modificar el peso (o
intensidad) de estas conexiones. Un año mas tarde, Shannon [Shannon, 1950] y Turing

en 1953 [Turing et al., 1953] escribieron programas que jugaban al ajedrez ejecutados
en computadoras que seguían el paradigma de Von Newmann. Para esta misma época se
creo SNARC [Minsky, 1954], una red neuronal que simulaba 40 neuronas utilizando
3000 tubos de vacío y partes de un bombardero B-24.
Según Stuart [Stuart, 1995] en 1954 Newell y Simon ya tenían programas que podían
utilizar razonamiento lógico, utilizando la teoría lógica. Simon declaró haber inventado
un programa computacional capaz de pensar de manera no numérica. Pero fue, según
Stuart [Stuart et al., 1995], en los finales de la década de los cincuenta en la que se
adopto el nombre que McCarthy le había dado a este campo de la computación por más
de 20 años: Inteligencia Artificial.
Si bien en los comienzos de la década de los cincuenta el poder computacional era muy
limitado, se desarrollaron teorías que hoy son básicas en el campo de la Inteligencia
Artificial, sobre todo en el campo del pensamiento humano y los protocolos que las
personas utilizan a lo largo de la resolución de un dado problema [Stuart et al., 1995].
En el año 1958, McCarthy en el MIT4, definió el lenguaje de alto nivel denominado

LISP, que se convertiría en el lenguaje dominante en el campo de la IA; si bien el uso
de tiempo de CPU era difícil de encontrar, en ese mismo año otros investigadores en el
MIT inventaron la política de “time sharing”. En 1959 Gelernter construye el Geometry
Theorem Prover [Gelernter, 1959], que como la lógica teórica, se utiliza para probar
teoremas utilizando representaciones explícitas de axiomas. Stuart [Stuart et al., 1995]
resalta que, luego de más de 45 años, muchos de los trabajos escritos entre 1958 y 1959
permanecen vigentes a la fecha de hoy. También en esta época, Friedberg [Friedberg et
al., 1959], comenzó a experimentar con la idea de evolución en la computadora, ahora
llamada Algoritmos Genéticos (AG).
Ya en la década de sesenta, existían laboratorios de Inteligencia Artificial y robótica en

las universidades más grandes del mundo (como el Massachussets Institute of
Technology y Standford University, entre otras) y el programa de Slagle llamado SAINT
creado en 1963 [Slagle, 1963] era capaz de solucionar problemas de cálculo que se le
entregaban a los estudiantes del primer año. Para 1968 Bertram con su SIR (Semantic
Information Retrieval) era capaz de contestar preguntas formuladas directamente en
ingles (utilizando un subconjunto de palabras de este idioma). Luego fue mejorado por
un programa que entendía el lenguaje natural, en 1972, por Winograd [Winograd,
1972]. En 1873 Woods construyó el sistema LUNAR [Woods, 1973], que permitía a los
geólogos realizar preguntas, en inglés, acerca de muestras de rocas traídas por el
programa espacial norteamericano Apollo desde la luna. Este fue el primer programa de
lenguaje natural en ser realmente utilizado.
El trabajo de Winograd [Winograd, 1972] mostró cómo una gran cantidad de elementos
pueden unirse colectivamente para representar un concepto individual, incrementando el
paralelismo y haciendo más robustas las aplicaciones [Stuart et al., 1995]. Recién en
esta época, todos los trabajos expuestos respondían de manera satisfactoria a un
pequeño conjunto de elementos de prueba, pero fallaban a la hora de trabajar con el
4
MIT es el acrónimo de Massachussets Institute of Technology (Instituto Tecnológico de
Massachussets), institución dedicada a la ciencia, la ingeniería y la investigación, fundada en 1861 por el
geólogo William Barton Rogers.

universo completo de posibilidades: esto se debe a que la IA representaba los hechos de

un problema de una manera determinada y establecía una serie de pasos a seguir para
resolverlos. Antes de que la teoría NP5 estuviera completamente desarrollada se suponía
que la escalabilidad de los problemas era solo cuestión de mejorar el hardware.
En 1979 se publicó el informe Lighthill [Lighthill, 1973] que contenía grandes críticas a
la IA y por el cual el gobierno británico suspendió el apoyo a la investigación en el área
de la IA. A este informe se le suma que las posibles aplicaciones de los algoritmos
desarrollados hasta la fecha era muy pocas, poniendo el ejemplo de que un Perceptron
[Rosenblatt, 1958] (originalmente implementado como una simulación en una IBM®
704) de únicamente 2 entradas, solo podía representar un conjunto muy limitado de
situaciones, y no fue hasta 1980 en que se desarrolló el algoritmo de Backpropagation
[Werbos, 1990] para redes complejas multicapa.
En este período Buchanan desarrolla el programa Dendral [Buchanan et al., 1969] que
realizaba la tarea de resolver la estructura molecular de una sustancia a partir de la
información que provenía de un espectrómetro de masa. Este programa, según Stuart
[Stuart et al., 1995] funcionaba de forma aceptable para moléculas complejas, probando
con esto que las técnicas de la IA pueden ser aplicadas a dominios reales y no solamente
a casos de laboratorio. Este fue el primer programa utilizado que contenía información
sobre el dominio y las reglas para resolverlas, además se lo puede ver como uno de los
precursores de los KBES6. Una de las primeras aplicaciones útiles fue MyCin de
Feigenbaum, Buchanan, y Shortliffe [Buchanan et al., 1984], para el diagnóstico de las
infecciones sanguíneas. Constaba de aproximadamente 450 reglas y se comportaba tan
bien como un experto, y considerablemente mejor que un doctor recién recibido. Es una
de las primeras aplicaciones que integra las incertezas dentro del dominio como una
forma de emular la complejidad del dominio médico, ya que varias enfermedades
pueden tener los mismos síntomas, o una enfermedad puede casi no presentar síntomas
mesurables.
A su vez, el sistema de razonamiento llamado Prospector creado por Duda en 1979

[Duda et al., 1980] generó una gran publicidad cuando recomendó una exploración en
profundidad de un sitio geológico, dando por resultado el descubrimiento de uno de los
más grandes depósitos de molibdeno. También se realizaron grandes avances en el
lenguaje natural en los que participaron Schank y Abelson en 1977, Schank y Riesbeck
en 1981 y Dyer en 1983 A su vez, se intentó describir la organización de la memoria del
cuerpo humano, por Rieger, 1976 y Kolodner, 1983 entre otros.
A partir del comienzo de la década de los ochenta, la Inteligencia Artificial dejó los
laboratorios para convertirse en una industria. Un ejemplo de ello es el Sistema Experto
(SE) “R1” utilizado por la Digital Equipment Corporation. Con este sistema la
5
Un problema del tipo NP (nondeterministic polynomial time) es aquel que es verificable en un tiempo
polinómico por una máquina no determinística de Turing, la cual puede seguir varios caminos
computacionales simultáneamente (con la restricción de que éstos no pueden comunicarse entre si).
Khachian demostró en 1979, que los problemas de la programación lineal eran del tipo P (polynomial
time) y no NP. [Borwein, et al, 1987]
6
Knowledge Based Expert Systems.

organización conformaba órdenes y pedidos de los nuevos sistemas de computadora,

logrando ahorros para 1986 de cuarenta millones de dólares al año.
También, a partir de la década de los ochenta, se anunció el proyecto de la “quinta

generación de computadoras”, ejecutable en 10 años en el cual las máquinas
interpretarían el lenguaje Prolog (o un lenguaje similar) como si fuese lenguaje de
máquina, pudiendo realizar millones de inferencias por segundo. Esto impulsó el interés
por la IA, haciéndola avanzar sobre pasos firmes. Además, condujo al rediseño de
algunos algoritmos, como el de Backpropagation [Werbos, 1990], el procesamiento
distribuido, planteado por Rumelhart y McClelland en 1986 [Rumelhart et al., 1986]
refuerza el impulso de la industria de la Inteligencia Artificial (IA).
Más tarde, comenzó el período que Stuart [Stuart et al., 1995] ubica de la década de los
ochenta a la actualidad, donde no se desarrollaron nuevas teorías revolucionarias, pero
se intentó refinar las teorías ya existentes para su correcto funcionamiento. Por ejemplo
Tate (1977) y Chapman (1987), realizaron una síntesis de un programa planificador
dentro de un framework7 para facilitar el trabajo, el que fue utilizado incluso para
programar las misiones espaciales. También se vio un resurgimiento del razonamiento
probabilístico dentro de los sistemas inteligentes, como plantea Pearl (1978) y defiende
Cheeseman [Cheeseman, 1985].
A principios de la década de los noventa, se vislumbró la aplicación nuevo paradigma

de programación. Se deja atrás la programación estructurada con la que se armaron las
primeras redes neuronales [Rosenblatt, 1958], quedando atrás la programación
orientada a objetos (OOP), que en el caso de la IA se ve representada por la teoría de
los marcos o “frames” [Minsky, 1974] y se encamina hacia la programación por
agentes. En 1987 se creó SOAR de Laird, Newell y Rosenbloom [Laird. et al, 1987] que
fue una de las primeras implementaciones de agentes que se utilizaba para procesar las
entradas de un sistema de sensores, pero en una visión más general se comportaba como
una arquitectura de resolución de problemas basada en reglas.
A finales de la década de los noventa e inicio del siglo XXI, con el advenimiento del
mayor poder computacional y de las grandes capacidades de almacenamiento de datos
con costos de hardware más reducidos, se terminó por aceptar a la Inteligencia Artificial
(IA) como un campo práctico y no solo teórico, en el cual los desarrollos aplicables son
posibles más allá de los laboratorios. Esto llevó a continuar la tendencia de menor
investigación en nuevas teorías, refinamiento de las teorías actuales, y la generación de
miles de productos que se utilizan hoy en día, a nivel masivo como en actual “clippo”,
el asistente de Microsoft Word, que utiliza una red bayesiana para satisfacer las
necesidades del usuario del procesador de texto.
Como se mostró en la Figura 2.1, la Inteligencia Artificial (IA) comprende otras áreas
que son: los sistemas basados en conocimiento (KBES), las redes neuronales, la
ingeniería del conocimiento (INCO), los sistemas expertos y los Sistemas Tutores
7
Un framework es una estructura extensible para describir un conjunto de conceptos, métodos y
tecnologías necesarias para un diseño completo y posterior manufactura de software, es una interface
común integrada para el proceso de diseño, implementación, conversión de datos, etc. que facilita la
producción de, en este caso, la planificación de las misiones espaciales.

Inteligentes (STI). En lo que sigue, se describen someramente cada una de ellas para
lograr una idea completa del ámbito de la Inteligencia Artificial (IA).
2.2.2 – El Algoritmo Inductivo C4.5
Es un algoritmo ideado por Quinlan [Quinlan, 1993], dentro de los métodos inductivos
del Aprendizaje Automático, que aprende a partir de ejemplos preclasificados y se
utilizan para modelar las clasificaciones en los datos mediante árboles de decisión.
Estos algoritmos han tenido gran impacto en la Minería de Datos.
El C4.5 [Quinlan, 1993] junto con antecesor el ID3 [Quinlan, 1987] forman parte de la
familia de los Top Down Induction Trees (TDIDT). La idea de ambos algoritmos es de
considerar todas las pruebas posibles que pueden dividir el conjunto de datos de entrada
y seleccionar la prueba que resulta con mayor ganancia de información.
Para cada atributo discreto, se considera una prueba con n resultados, siendo n el
número de valores posibles que puede tomar el atributo. Para cada atributo continuo, se
realiza una prueba binaria sobre cada uno de los valores que toma el atributo en los
datos. Existen dos tipos de ejemplos:
· Positivos: Fuerzan la generalización de las reglas generadas, que en casos

extremos, donde la población tiene una varianza muy baja a reglas que se
adapten muy bien a las muestras y muy mal a los ejemplos negativos.
· Negativos: Se utilizan para prevenir que la generalización sea excesiva. Se debe

encontrar la relación justa de ejemplos negativos y positivos para el
entrenamiento del algoritmo y la generación de cada una de las reglas
Se pretende entonces que el conocimiento adquirido cubra todos los ejemplos positivos
y ningún ejemplo negativo, manteniendo que los ejemplos sean representativos de los
conceptos que se están tratando de enseñar. Además, la distribución de las clases en el
conjunto de ejemplos de entrenamiento, a partir de los que el sistema aprende, debe ser
similar a la distribución existente para los datos en los cuales se aplicará el sistema.
2.2.2.1 – Construcción de los Árboles de Decisión
Los árboles TDIDT, se construyen basados en el método de Hunt [Hunt et al., 1975]. Se
parte de un conjunto de elementos T de entrenamiento:
{
TM [a 1(1) , a (1) (1) (1) (1) (2) (2) (2) (2) (1) (M) (M) (M) (M) (1)
2 , a 3 ,..., a n , C1- k ], [a 1 , a 2 , a 3 ,..., a n , C1- k ],...,[a 1 , a 2 , a 3 ,..., a n , C1- k ] }
Dadas las clases {C1, C2,. . ., Ck}, existen tres posibilidades:
· TM contiene uno o más casos todos pertenecientes a un única clase Cj: El

árbol de decisión resultante para T esta compuesto sólo por una hoja
identificando la clase Cj.

· TM no contiene ningún caso: El árbol de decisión es una hoja, pero la clase

asociada debe ser determinada por información que no pertenece a T. Por
ejemplo, una hoja puede escogerse de acuerdo a conocimientos de base del
dominio, como ser la clase mayoritaria.
· TM contiene casos pertenecientes a varias clases: Este es el caso interesante.

Se refina T en subconjuntos de casos que tiendan hacia una colección de casos
de una única clase.
Se elige una prueba basada en un único atributo, que tiene uno o más resultados,
mutuamente excluyentes y T se particiona en los subconjuntos donde Ti contiene
todos los casos de T que tienen el resultado Oi para la prueba elegida.
O={O1, O2,. . ., On}
T=T1, T2,. . ., Tn
El árbol de decisión para T consiste en un nodo de decisión identificando la

prueba, con una rama para cada resultado posible. El mecanismo de construcción
del árbol se aplica recursivamente a cada subconjunto de datos de
entrenamientos, para que la i-ésima rama lleve al árbol de decisión construido
por el subconjunto Ti de datos de entrenamiento.
Lo importante es seleccionar el “mejor” atributo con respecto al cual realizar la

partición. Para ello, se requiere utilizar la teoría de la información, que declara
que la información se maximiza cuando la entropía8 se minimiza.
Si se tienen ejemplos positivos y negativos, se puede calcular la entropía H(Si)

de un subconjunto Si como:
( ) ( )
H ( s i ) = - p i+ × log p i+ - p i- × log p i- (2.1)
n i+ ni-
p i+ = Ù p i- = (2.2)
ni+ + ni- ni+ + ni-
8
La entropía determina el nivel de caos o la azarosidad de un conjunto de datos. La entropía se define
como la cantidad de información que se espera observar cuando un evento ocurre según una distribución
de probabilidades. Para una distribución de probabilidades dada, la entropía mide la incertidumbre. Si
tomamos un conjunto con elementos positivos y negativos, la entropía variará entre 0 y 1. Es 0 si todos
los ejemplos pertenecen a la misma clase, y 1 cuando hay igual número de ejemplos positivos y negativos
en el conjunto de datos.
La probabilidad de que un ejemplo tomado al azar pertenezca a la clase i y se calcule en base a la
frecuencia de los datos de dicha clase en los datos de entrenamiento, se representa en la siguiente
fórmula:
N
H ( s i ) = -å - p i × log ( p i )
i =1

Entonces, el atributo at divide el conjunto T en los subconjuntos Si (0 £ i £ n).

Así, la entropía total del sistema es H(T), H(Si) es la entropía del subconjunto Si
y p(Si) es la probabilidad de que un ejemplo pertenezca al subconjunto Si .
( )
H ( s i ) = - p i+ × log p i+ - p i- × log p i-( ) (2.3)
+ n i+ - ni-
p =
i Ú p =
i (2.4)
ni+ + ni- ni+ + ni-
La ganancia en información puede calcularse como la disminución en entropía,

es decir:
N
H ( S , at ) = å p (s i ) × H ( s i ) (2.5)
i =1
si
p( s i ) = (2.6)
S
I ( S , at ) = H ( S ) - H ( S , at ) (2.7)
Donde H(S) es el valor de la entropía a priori, antes de realizar la subdivisión, y

H(S,at) es el valor de la entropía del sistema de subconjuntos generados por la
partición según el atributo at. Por lo tanto, queda definida la ganancia de
información como I(S,at), para seleccionar luego el atributo at cuya ganancia sea
máxima [Quinlan, 1993].
2.2.2.2 – Parámetros Para el Análisis de los Árboles de TDIDT
El algoritmo C4.5 debe ser modificado: originalmente este algoritmo de inducción

generaba árboles de decisión donde cada una de las ramas del árbol conducía, luego de
n pasos, a hojas las cuales representan al 100% de las observaciones sin error de
categorización. Si se lo modifica para que las clasificaciones puedan contener un
pequeño porcentaje de error, se deben analizar tres conceptos claves para las reglas
generadas, es decir, para interpretar como éstas se adaptan al modelo de reglas con
respecto a los datos provenientes de las observaciones iniciales. Estas definiciones son:
· Soporte (o Support): Que se define como el porcentaje del grupo de

entrenamiento para el cual el lado izquierdo de la regla (en inglés “Left Hand
Side” o LHS) es verdadero. Se puede definir que si para una observación en
particular su LHS es verdadero, entonces la regla se aplica a esa observación. Es
una medida de la aplicabilidad de la regla generada.
· Confianza (o Confidence): A partir de las observaciones que cumplen que su

LHS sea verdadero, el porcentaje de observaciones para las cuales su lado
derecho (“Right Hand Side” a RHS) es verdadero. En otras palabras, para el
porcentaje de las observaciones para las cuales la regla se aplica, ésta también es
verdadera. Es una medida de la exactitud de la regla generada.

· Captura (o Capture): Es el porcentaje de la clase predicha que es

correctamente capturado por la regla. Si existe una regla con una captura cercana
al 100% significa que, en el espacio de la predicción final, todas las
observaciones de esta clase se encuentran cercanas entre ellas, y la regla puede
capturar esa parte del espacio predictor de manera muy exacta.
Se puede resumir también de la siguiente manera, para dar un panorama más

simplificado a cada uno de estos parámetros:
· ¿Qué tan aplicables son las reglas generadas? O sea su soporte.
· ¿Cuál es la medida de la exactitud de las reglas generadas? Es decir, su

confianza.
· ¿Qué parte del espacio predictor puede una regla capturar de manera exacta? O
sea, su captura.
2.2.2.3 – La Poda de los Árboles.
Los árboles generados por los métodos del tipo TDIDT a veces no son óptimos para ser
utilizados en cualquier situación ya que puede producirse la sobregeneralización (u
overfitting), donde el gran tamaño del árbol o la evaluación de atributos poco
significativos llevan a árboles muy aptos para los ejemplos positivos, pero que
funcionan de manera pobre para los negativos. Se busca entonces la poda de los árboles
generados para su simplificación sin agregar demasiado error en la clasificación
resultante.
El objetivo siempre es maximizar la ganancia de información I(S,at), lo cual, no

necesariamente implica una mayor cantidad de ella pues, puede suceder que se esté
tratando con ejemplos de entrenamiento con ruido o atributos evaluados no relevantes
que solo agregan niveles, dificultan su interpretación y no contribuyen a la ganancia
neta de información. Por esta razón, se hace necesaria la poda, para lo cual existen dos
enfoques para podar árboles:
· Preprunning o pre-poda: Detiene el crecimiento del árbol cuando la ganancia

de información producida al dividir un conjunto no supera un umbral
determinado como parámetro del algoritmo. En este caso, no se pierde tiempo en
construir una estructura que luego será simplificada en el árbol final. Si la
ganancia de información en una división cualquiera Si es menor que el umbral,
la división se descarta y se genera el árbol para ese subconjunto en particular
simplemente como la hoja más apropiada, induciendo un porcentaje de error,
siempre menor que el umbral.
· Postprunning o post-poda: Se aplica sobre algunas ramas una vez que se ha

terminado. La post-poda es utilizada por los algoritmos ID3 y el C4.5 y realiza
la tarea de simplificar según los criterios propios de cada uno de estos
algoritmos una vez construido el árbol.

De esta manera se puede implementar un algoritmo de Aprendizaje Automático (AA)

capaz de aprender a partir de ejemplos preclasificados, generando en este caso en
particular, un árbol de decisión que permite llegar a la clasificación final evaluando los
atributos de los ejemplos.
2.3 – Redes Neuronales
2.3.1 – El Modelo Biológico
Una neurona es una célula viva que consta de un cuerpo celular relativamente esférico
de 5 a 10 micrones de diámetro, denominado soma, del que se desprende una rama
principal o axón y varias ramas más cortas llamadas dendritas. A su vez, el axón
presenta ramas en torno a su punto de arranque, y se ramifica extensamente en su
extremo.
Una de las características que diferencia a las neuronas de otras células, es la capacidad
de comunicarse, denominada en el campo de la biología como sinapsis neuronal. Las
dendritas y el cuerpo celular reciben señales de entrada, el cuerpo celular las combina e
integra y emite señales de salida. Estas señales pertenecen a dos naturalezas:
· Química: La señales que se transmiten entre los terminales axónicos y las

dendritas se realiza mediante moléculas de sustancias químicas llamadas
neurotransmisores que fluyen a través de unos contactos denominados sinapsis,
estando estos localizados entre los terminales axónicos y las dendritas de las
neuronas siguientes, dejando entre estos un espacio sináptico entre 50 y 200 Å.
· Eléctrica: La señal generada por la neurona, que se transporta a lo largo del

axón es un impulso eléctrico La neurona contiene interiormente un líquido cuya
composición defiere de la del líquido del exterior, con una concentración diez
veces mayor de iones potasio, mientras que el medio externo contiene diez veces
más iones sodio. Esta diferencia de concentraciones genera una diferencia de
potencial entre el interior y el exterior de la membrana celular del orden de los
70 mV que se conoce con el nombre de potencial de reposo. La recepción de
neurotransmisores actúa acumulativamente bajando, o subiendo, ligeramente el
valor del potencial de reposo. El resultado de todo esto es la emisión por parte
de la neurona, de trenes de impulsos cuya frecuencia varía en función de la
cantidad de neurotransmisores recibidos. Existen dos tipos de sinapsis:
Excitadoras (Cuyos neurotransmisores provocan disminución de potencial en la
membrana celular, facilitando la generación de impulsos) e Inhibidoras (Cuyos
neurotransmisores tienden a estabilizar el potencial, dificultando la emisión de
trenes de impulsos).
Característica Computadora Cerebro Humano

Unidades computacionales 109 compuertas 1011 neuronas
Unidades de almacenamiento 109 RAM 1010 Disk 1014 sinapsis
Tiempo de ciclos 3 .10-10 segundos 10-3 segundos
Ancho de banda 6.109 bits/segundo 1014 bits/segundo
Unidades actualizadas por segundo 10 9 compuertas 1014 neuronas
Tamaño 0.18.10-6 metros 5.10-6 metros
Tabla 2.1: Comparación entre el cerebro humano y una computadora.

La Tabla 2.1 muestra una comparación entre las unidades fundamentales informáticas y
su similitud con las células del cerebro humano. Esta tabla se basa en el libro Artificial
Intelligence A Modern Approach de Stuart [Stuart et al., 1995] pero los datos
computacionales son llevados al año 2004.
2.3.2 – Redes Neuronales Artificiales (ANN)
Son modelos que intentan reproducir el comportamiento del cerebro que constan de
dispositivos elementales de procesamiento denominados neuronas artificiales. Una
definición global podría ser: “una red neuronal artificial es un procesador distribuido,
masivamente paralelo, que tiene una predisposición natural a almacenar conocimiento
experimental y hacerlo disponible para su utilización”.
Otras definiciones válidas son, las que plantea ARPA9 en su Neural Network Study
[DARPA, 1988] en la que una: “red neuronal artificial es un sistema compuesto de
muchos elementos simples de procesamiento operando en paralelo y cuya función es
determinada por la estructura de la red, fuerza de las conexiones y el procesamiento
llevado a cabo en los elementos individuales o nodos”. Por su parte, Kohonen plantea
[Kohonen, 1998] que: “una red neuronal artificial es un conjunto de redes
interconectadas masivamente en paralelo de elementos simples, usualmente
adaptativos, y con organización jerárquica, las cuales intentan interactuar con los
objetos del mundo real del mismo modo que lo hace el sistema nervioso biológico”.
Existen también otros estudiosos que han desarrollado definiciones similares, como
Haykin [Haykin, 1999] y Gurney [Gurney, 1995].
También existen definiciones que se aproximan más a los modelos biológicos, como la
de Zurada [Zurada, 1992], quien plantea que “una red neuronal artificial, es un sistema
celular físico que puede adquirir, almacenar y utilizar el conocimiento experimental”.
Independientemente de las diferencias en las distintas definiciones, el elemento clave
del paradigma de las redes neuronales artificiales son las estructuras novedosas del
sistema de procesamiento de la información.
La neurona artificial pretende simular las características más importantes de las

neuronas biológicas. Cada una se caracteriza en un instante cualquiera por un estado de
activación que transforma el estado actual en una señal de salida. En los sistemas
biológicos el proceso de cambio de estado es un proceso asincrónico, mientras que en
las neuronas artificiales este proceso es sincrónico. Existen tres tipos de neuronas:
· De Entrada: son aquellas que reciben estímulos externos, relacionadas con el

aparato sensorial y cumplen la función de ingreso de información al sistema.
9
Advanced Research Projects Agency (ARPA), creada por la directiva 5105.15 del Departament of
Defense (DoD) de los Estados Unidos. Su responsabilidad principal es el desarrollo de proyectos
avanzados en los campos de investigación y desarrollo que designe individualmente el Departamento de
Defensa. Antes de 1993 su nombre era DARPA (Defense Advanced Research Projects Agency).
http://www.darpa.mil. Consultado el 08/11/2005

· Ocultas: Son aquellas que se encargan de procesar la información ingresada. Se

genera algún tipo de representación interna de la información y se la procesa.
· De Salida: Una vez finalizado el período de procesado, la información llega a

las unidades de salida, cuya misión es dar la respuesta del sistema.
Esta visión representa al cerebro humano como una máquina, que ostenta ciertas
cualidades de procesamiento de la información que la ciencia intenta imitar [Nilson,
2001].
2.3.2.1 – La Neurona Artificial
El objetivo de una neurona artificial es recibir las entradas de las neuronas vecinas y
calcular un valor de salida que es enviado todas las neuronas conectadas con ella. Todas
las neuronas que componen la red se hallan en un determinado estado, pudiendo tomar
valores continuos o discretos.
Axónes
Vainas de Melanina
Entrada1 g1
q
Entrada2 g2
n Salida
Z = å X i × Wi
i =1 f (z )
Entrada3 g3
Entradan G
n
Axones Dendritas Cuerpo Axón Sinapsis Dendrita Cuerpo o

Sinapsis Soma
Figura 2.2.a Figura 2.2.b10
Figura 2.2: Esquema de una neurona artificial (2.2.a) y una célula neuronal del cerebro humano (2.2.b).
Asociada con cada unidad neuronal denominada U i existe una función denominada de
activación, f ( Neti ) , que transforma la entrada neta de la neurona en una señal de salida
yi (t ) = f ( Neti (t )) . La salida está dada por una función continua cualquiera definida
dentro de un intervalo. Toda función con límites inferiores y superiores y que posea un
incremento monotónico será una función de activación satisfactoria. Las funciones de
activación típicas son:
§ Función Escalón: la salida, que en este caso es binaria, solo se activa cuando la
entrada neta es mayor a cierto valor umbral predefinido:
10
Imagen tomada de Walsh, Anthony A. Sitio web http://inside.salve.edu/walsh/, consultado el
08/11/2005.

ìï0 x £ Umbral Como el valor Umbral es definido por el

f ( x) = í usuario, se suele tomar el valor medio de
ïî1 x > Umbral la máxima suma de las entradas.
§ Función Sigmoidal (o logística): Un caso particular sería la función lineal

mixta f ( x ) = x . La función de activación sigmoidal es la más utilizada en la
actualidad:
1 f(x) es una función continua, derivable y

f ( x) = acotada dentro del intervalo [0, 1]
1 + e-x
§ Función Gaussiana: la campana de Gauss permite de manera muy simple

centrar el intervalo (en ancho y altura) en el que se desean obtener las salidas
determinadas para cada una de las neuronas.
- 1 2×
( x - mi )2 Donde mi Es la media de la clase i y si Es
1 s i2
f ( x) = 2 ×e la varianza de la clase i
s i 2 ×p
Figura 2.3.a Figura 2.3.b
Figura 2.3.c Figura 2.3.d

Figura 2.3: Distintas funciones de activación para las neuronas artificiales. En la Figura 2.3.a se puede
ver la función de activación triangular. En la Figura 2.3.b se puede ver la función de activación
trapezoidal. En la Figura 2.3.c se ve la función de activación sigmoidal. Y en la Figura 2.3.d se ve la
función de activación normal.

2.3.2.2 – Aprendizaje de las Redes Neuronales Artificiales
El aprendizaje de las redes neuronales artificiales se puede definir de dos maneras:

como la modificación del comportamiento inducido por la interacción con el entorno y
como resultado de las experiencias conducentes al establecimiento de nuevos modelos
de respuesta a estímulos externos [Zurada, 1992].
En el campo de las redes neuronales, el aprendizaje es el proceso por el cual una señal
modifica los pesos de la red en respuesta a la información de entrada [Krishnamoorthy,
1996]. Existen dos criterios para clasificar el tipo de aprendizaje: el primero respecto a
la supervisión, que se divide en:
· Supervisado: el entrenamiento es controlado por un agente externo,

denominado maestro o supervisor, que determina la respuesta que debería
generar la red y en caso de no coincidir la respuesta real con la deseada, el
supervisor procede a modificar el peso Wi de las conexiones. Algunas formas de
llevarlo a cabo son:
o Aprendizaje por corrección de errores: Ajusta los pesos de las conexiones

en función del error cometido en la salida. Un ejemplo es la regla de
aprendizaje del Perceptrón que desarrolló Rosenblatt en 1958 [Rosenblatt,
1958]. El algoritmo planteado consideraba únicamente los errores
individuales teniendo en cuenta los errores individuales y no el error global
cometido durante el proceso completo de aprendizaje de la red, por lo tanto
este algoritmo fue mejorado por Widrow y Hoff en 1960 [Widrow et al.,
1960] y fue denominado regla delta o regla del mínimo error cuadrado
(LMSE).
1 P N (k )
Errorglobal = åå
2 P k =1 j =1
( y j - d (j k ) ) 2 (2.8)
Siendo:
N: Número de neuronas de salida.
P: Número de informaciones que debe aprender la red.
Otro algoritmo de aprendizaje por corrección de errores es el Least Mean

Square Error (LMS) y se trata de una generalización de la regla delta para
redes forward con n capas ocultas [Rumelhart et al., 1986].
o Aprendizaje por refuerzo: Durante el entrenamiento no se indica la salida

que se desea que proporcione la red ante una determinada entrada. Entonces,
la función del supervisor es, la de indicar mediante una señal de refuerzo si
la salida obtenida en la red se ajusta a la deseada; en función de ello se
ajustan los pesos basándose en un mecanismo de probabilidades. Una
implementación del algoritmo por refuerzo lo constituye el denominado
Linear Reward-Penalty o LR-P de Narendra y Thathacher en 1974 [Narendra
et al., 1974]. Luego, fue ampliado por Barto y Anand, quienes en 1985
desarrollaron el denominado Associative Reward Penalty [Barto et al., 1983]
que se aplica en redes con forwarding y varias capas. Otro algoritmo por
refuerzo es el conocido como Adapive Heuristic Critic, introducido por

Barto, Sutton y Anderson en 1983 [Barto et al., 1983] para redes de varias
capas con modificaciones para soportar el refuerzo.
o Aprendizaje estocástico: Consiste en realizar cambios aleatorios en los

valores de los pesos de las conexiones de la red y evaluar su efecto a partir
del objetivo deseado y de distribuciones de probabilidades. Una vez
realizados los cambios se determina la energía de la red, la cual es una
función denominada de Lyapunov [Hopfield, 1982]. Si la energía es menor
después del cambio: el comportamiento de la red se acerca al deseado y se
acepta el cambio. Sino, solo se acepta el cambio según una distribución de
probabilidades. Una red que utiliza este tipo de aprendizaje es la Boltzman
Machine ideada por Hinton, Ackley y Sejnowsky en 1984 [Ackley et al.,
1985], que utiliza un Hebbiano con regla delta [Widrow et al., 1960]. Este
tipo de aprendizaje corre el riesgo de caer en mínimos locales de la función
de Lyapunov, para evitarlo se utiliza normalmente el procedimiento
denominado Simulated Annealing.
Algunas redes neuronales que utilizan este tipo de aprendizaje son: Perceptrón
[Rosenblatt, 1958], Adaline/Madaline [Widrow, 1960], Backpropagation
[Rumelhart et al., 1986], Brain State-In-a-Box [Anderson et al., 1977],
Counterpropagation [Hetcht-Nielsen, 1988], Linear Reward Penalty [Barto et
al., 1983] Associative Reward Penalty [Barto et al., 1983], Adaptive Heuristic
Critic [Barto et al., 1983], Boltzmann Machine [Ackley et al., 1985], Cauchy
Machine [Ackley et al., 1985].
· No Supervisado: En este caso no existe un agente externo que controle el

proceso de aprendizaje de la red, por lo que se lo denomina autosupervisado. La
red no recibe información externa que le aclare si la salida generada fue correcta
o no. Existen varias formas de interpretar de la salida de estas redes, las cuales
dependen de su estructura, organización y algoritmo de aprendizaje que la
generó, pero se podría decir que la salida representa el grado de familiaridad
entre la información que se le proporciona a la entrada y la información
entregada hasta entonces. Algunas maneras de llevar a cabo este tipo de
aprendizaje son:
o Aprendizaje Hebbiano: Hebb en 1949 postuló: “Cuando un axón de una

celda A está suficientemente cerca como para conseguir excitar una celda B
y repetida o persistentemente toma parte en su activación, algún proceso de
crecimiento o cambio metabólico tiene lugar en una o ambas celdas, de tal
forma que la eficiencia de A, cuando la celda a activar es B, aumenta”.
Hebb entiende por celda a un conjunto de neuronas fuertemente conectadas a
través de una estructura compleja [Hebb, 1949].
Se trata de una regla de aprendizaje no supervisado, pues la modificación de

los pesos se realiza en función de las salidas de las neuronas obtenidas tras la
presentación de cierto estímulo, sin tener en cuenta si se deseaba obtener o
no esos estados de activación.
Este tipo de aprendizaje fue empleado por Hopfield 1982 [Hopfield, 1982;
Fausett, 1994], Grossberg lo utilizó en 1968 en la red Additive Grossberg

[Grossberg, 1976] y en 1973 en la red Shunting Grossberg [Carpenter et al.,

1991]. Learning Matrix (LM), desarrollada por Steinbuch en 1961 [Stuart,
1995] también aprendía mediante correlación hebbiana. Otras redes que
utilizan el aprendizaje hebbiano son: la red Bidirectional Associative
Memory (BAM), desarrollada por Kosko en 1988, la red desarrollada por
Amari en 1972 llamada Temporal Associative Memory (TAM) [Wan et al.,
1990], Linear Associative Memory (LAM) introducida por Anderson en
1968 [Anderson et al., 1977] y refinada por Kohonen, y la red Optimal
Linear Associative Memory (OLAM) desarrollada de forma independiente
por Wee en 1968 [Wee, 1968] y por Kohonen en 1973 [Kohonen et al.,
1988].
Existen variaciones del aprendizaje hebbiano: por ejemplo, Sejnowski

[Sejnowski, 1977] en 1977 utilizó la correlación de la covarianza de los
valores de activación de las neuronas, Sutton y Barto en 1981 utilizaron la
correlación del valor medio de una neurona con la varianza de la otra [Barto
et al., 1983a]. Klopf usó en 1986 el drive-reinforcement en las redes del
mismo nombre [Klopf, 1986]. El aprendizaje hebbiano diferencial se utiliza
en la red feedforward/feedback de dos capas denominada ABAM (Adaptive
Bidirectional Associative Memory) introducida por Kosko en 1987 [Kosko,
1988]. También este autor en 1987 presentó Fuzzy Associative Memory
(FAM) [Carpenter et al., 1992]. Además existen implementaciones del
aprendizaje Hebbiano con otras reglas, como es el caso de las redes
Boltzmann Machine [Ackley et al., 1985] y Cauchy Machine [Ackley et al.,
1985] basada en la Boltzmann Machine pero con otra función de distribución
[Jang et al., 1997].
o Aprendizaje Competitivo y Cooperativo: En este caso las neuronas

compiten (y cooperan) unas con otras con el fin de llevar a cabo una tarea
dada. Cuando se presenta cierta información de entrada, sólo una de las
neuronas de salida de la red, o una por determinado grupo de neuronas, se
activa alcanzando su valor de respuesta máximo. Por lo tanto, las neuronas
compiten por su activación, quedando una por grupo, como neurona
vencedora (Winner Take All Unit) y anulado el resto de las neuronas, que son
forzadas al valor de respuesta mínimo. Las redes neuronales del tipo S.O.M.
utilizan una técnica de este tipo [Kohonen, 2001].
La competencia entre neuronas se realiza en todas las capas de la red, las

neuronas poseen conexiones recurrentes de autoexcitación y conexiones de
inhibición por parte de neuronas vecinas. Si el aprendizaje es cooperativo,
estas conexiones con las vecinas serán de excitación.
Rumelhart y Zisper en 1986 [Rumelhart, 1986] aplicaron esta teoría

dividiendo cada capa en grupos de neuronas, con conexiones inhibidoras con
otras neuronas de su mismo grupo, y excitadoras con las de la siguiente capa.
El aprendizaje afecta sólo a las neuronas ganadoras, redistribuyendo el peso
total entre sus conexiones, sustrayendo una parte de las neuronas perdedoras.
Kohonen desarrolló una variación de este tipo aprendizaje llamado Learning
Vector Quantization (LVQ) [Kohonen, 2001]. Fukushima en 1975 desarrolla
una red multicapa llamada Cognitron [Fukushima, 1975], fuertemente

inspirada en la anatomía del sistema visual humano, y en 1980 diseña una

versión mejorada denominada Neocognitron [Fukushima et al., 1983;
Fukushima, 1988]. Kohonen en 1982 planteó Feature Mapping, que
permiten obtener mapas topológicos en los que, estarían representadas las
características principales de las informaciones presentadas a la red. Otro
caso particular del aprendizaje competitivo, denominada teoría de la
resonancia adaptativa desarrollada por Carpenter y Grossberg en 1976
[Grossberg, 1976] y utilizada en la red ART (en su versión binaria y
analógica) [Carpenter et al., 1991].
Algunas redes neuronales que utilizan este tipo de aprendizaje son: Hopfield
[Hopfield, 1982], Learning Matrix [Stuart, 1995], Temporal Associative
Memory [Wan et al., 1990], Linear Associative Memory (LAM) [Anderson et
al., 1988], Optimal LAM (OLAM) [Kohonen et al., 2001], Drive-Reinforcement
[Stuart, 1995], Fuzzy Associative Memory [Carpenter et al., 1992], Additive
Grossberg [Grossenberg, 1976], Shunting Grossberg [Carpenter et al., 1992],
Bidirectional Associative Memory (BAM) [Kosko, 1988], Adaptive BAM
[Kosko, 1988], Learning Vector Quantized [Kohonen, 2001],
Cognitron/Neocognitron [Fukushima, 1975; Fukushima, 1988], Topology
Preserving Map o S.O.M. [Kohonen, 2001], Adaptive Resonance Theory
[Carpenter et al., 1987].
Una segunda clasificación sobre la forma del aprendizaje es la que considera el estado
de la red durante el aprendizaje:
· On-Line: La red puede aprender durante su funcionamiento habitual, no se

distingue fase de entrenamiento y de operación. Los pesos de las conexiones
varían dinámicamente con cada nueva entrada del sistema. En el aprendizaje on
line la estabilidad de la red es un aspecto fundamental que debe ser estudiado
con profundidad.
Algunas redes neuronales que utilizan este tipo de aprendizaje son: Adaptative
Grossberg [Grossberg, 1976], Shunting Grossberg [Grossberg, 1976],
Bidirectional Associative Memory (BAM) [Stuart, 1995], Adaptive BAM
[Kosko, 1988], Adaptive Resonance Theory [Carpenter et al., 1987].
· Off-Line: Se pueden distinguir dos fases: una de entrenamiento o aprendizaje y

otra de operación. Para el entrenamiento se utiliza un conjunto de datos de
entrenamiento y después se evalúa con un conjunto de datos de test. Luego del
entrenamiento los pesos de la red permanecen constantes a lo largo de la fase de
operación. Por su carácter estático no presentan problemas de estabilidad.
Algunas redes neuronales que utilizan este tipo de aprendizaje son: Hopfield
[Hopfield, 1982], Learning Matrix [Stuart et. al, 1995], Temporal Associative
Memory [Wan et al., 1990], Linear Associative Memory (LAM) [Anderson et
al., 1988], Optimal LAM [Kohonen et al., 2001], Drive-Reinforcement [Stuart,
et al., 1995], Fuzzy Associative Memory [Carpenter et al., 1992], Learning
Vector Quantizer [Kohonen, 2001], Cognitron/Neocognitron [Fukushima, 1975;
Fukushima, 1983; Fukushima, 1988], Topology Preserving Map o S.O.M.
[Kohonen, 2001].

2.3.2.3 – Topología de las Redes Neuronales
La topología es la disposición de las neuronas que forman la red, las cuales forman
capas o agrupaciones de neuronas que están alejadas en mayor o menor medida de la
entrada y la salida de la red. En este sentido, los parámetros fundamentales de red son:
· El número de capas.
· El número de neuronas por capa.
· El grado de conectividad.
· El tipo de conexiones entre neuronas.
Se puede presentar también, una clasificación según el número de capas. En cada caso
se describirán brevemente las distintas implementaciones que existen para cada una de
ellas:
· Redes Monocapa: En las redes monocapa, las neuronas que componen la única
capa que existe, deben cumplir las tres funciones básicas de la red: de entrada de
datos, de procesamiento de datos y de salida de información. Pueden existir
conexiones autoconcurrentes o no. Algunas de las implementaciones más
conocidas son:
· Redes Multicapa: Disponen de conjuntos de neuronas agrupadas en varios

niveles (donde n ³ 2). Ahora las conexiones de las neuronas pueden estar solas
en una capa, en varias o en todas; por lo tanto vale la pena aclarar los dos tipos
básicos de redes multicapa:
o Feedforward: Donde todas las señales neuronales se propagan hacia delante

a través de las capas de la red. Normalmente las conexiones recurrentes no
son útiles en aplicaciones de reconocimiento o clasificación de patrones.
o Feedforward/feedback: En este tipo de redes circula información tanto

hacia delante como hacia atrás durante el funcionamiento de la red. Algunas
redes neuronales tienen un funcionamiento denominado resonancia, donde la
información de las n capas interactúa entre sí hasta que alcanza un estado
estable.
En la Figuras 2.4, 2.5 y 2.6 se ven los esquemas de los tres tipos de redes neuronales.
En la Figura 2.4 se ve una red neuronal del tipo Hopfield [Hopfield, 1982] con
conexiones recurrentes. En la Figura 2.5 se muestra una red neuronal del tipo
Backpropagation [Rumelhart et al., 1986], con capas ocultas y conexiones hacia
adelante y en la Figura 2.6 se ve el esquema general de una red autoorganizada del tipo
S.O.M. [Kohonen, 2001].

Retroalimentación
Entrada1 N1 Salida1
Entrada2 N2 Salida2
Entrada3 N3 Salida3
Entrada4 N4 Salida4
Entradan Nn Salidan
Capa de Capa de
Entrada Salida
Figura 2.4: Modelo de Hopfield [Hopfield, 1982] de red neuronal artificial. Es una red monocapa con
conexiones recurrentes.
A continuación se analizarán en particular las dos redes que serán utilizadas en el

desarrollo de la tesis, que son las redes Backpropagation [Rumelhart et al., 1986]
propuestas por Rumelhart, Hinton y Williams en 1986 y las redes S.O.M. [Kohonen,
2001] propuestas por Kohonen en 1982.
2.2.3 – Redes Backpropagation [Rumelhart et al., 1986]
En 1986 Rumelhart, Hinton y Williams [Rumelhart, 1986], desarrollaron un método de

aprendizaje automático que logró que una red neuronal basada en el Perceptron
[Rosenblatt, 1958] aprendiera la asociación que existe entre los patrones de entrada y las
clases correspondientes de salidas.
El Aprendizaje Automático o “Machine Learning” podría definirse como un conjunto

de programas computacionales que mejoran con la experiencia. Estos sistemas deben
ser capaces de adquirir conocimientos de alto nivel para la resolución de problemas
mediante ejemplos provistos por un instructor o supervisor debiendo generar
representaciones internas de los conceptos.
Para lograrlo, se modificó la red del Perceptron de Rosenblatt [Rosenblatt, 1958]

agregándole capas ocultas, con conexión hacia delante y sin conexiones recurrentes
[Rumelhart, 1986]. No fue suficiente con introducir algunas modificaciones topológicas
a la red, sino que se requerían modificaciones en el algoritmo de aprendizaje; por lo
tanto fue desarrollado el método de aprendizaje no supervisado denominado también
Backpropagation, basado en la regla Delta Generalizada [Rumelhart et al., 1986],
logrando así, una ampliación del rango de aplicación de las redes neuronales.

El algoritmo de aprendizaje Backpropagation [Rumelhart et al., 1986] puede aplicarse

en redes neuronales artificiales con más de dos capas de neuronas y es capaz de
representar el conocimiento en las capas ocultas, logrando así la correspondencia entre
las entradas y las salidas.
El funcionamiento general de una red neuronal artificial del tipo Backpropagation,

como el de otras redes neuronales, puede dividirse en dos partes: la etapa de
entrenamiento y la etapa de puesta en marcha. La primera consiste en el aprendizaje de
un conjunto predefinido de observaciones de entrada-salida dados como ejemplo
(utilizando n atributos de entrada y un único atributo o clase, de salida), empleando un
ciclo propagación-adaptación de dos fases [García Martínez et al., 2003; Rumelhart,
1986]:
· Primera Fase: Se aplican los atributos de entrada en la capa de entrada de datos

de la red. Los valores generados por las neuronas de entrada se propagan desde
la capa de entrada hacia las capas superiores hasta generar una salida, en la capa
de salida de la red. Para realizar el entrenamiento, se compara el resultado
obtenido en cada neurona de salida con el valor deseado para cada neurona en
particular y se obtiene un error para cada una de las unidades de salida.
· Segunda Fase: Los errores de las unidades de salida se transmiten hacia atrás,
pasando por todas las neuronas de las capas intermedias que contribuyan
directamente a la salida, recibiendo el porcentaje de error aproximado a la
participación de las neuronas intermedias en la salida original. Este proceso se
repite capa por capa hasta llegar a la capa de entrada y hasta que cada neurona
haya recibido un error que describa su aporte al error total.
Es por esto que este algoritmo se denomina también de retro-propagación o

propagación hacia atrás, donde los errores se calculan con respecto a los aportes
de las neuronas desde la capa de salida hasta la capa de entrada y es con respecto
al valor del error recibido que se reajustan los pesos de las conexiones entre cada
par de neuronas en la red, de manera de que el error total cometido para ese
patrón disminuya.
En la fase de funcionamiento normal, los pesos no se modifican y por lo tanto, dados los
atributos en las neuronas de entrada, se obtienen las distintas activaciones de las
neuronas de salida como cualquiera de las redes neuronales que no cumplen con la
característica “Winner Takes All” (del inglés. el ganador toma todo) de esta sección.
Dado que la fase de funcionamiento es similar a las redes estudiadas se debe realizar un
análisis más profundo en el método de aprendizaje. El método de Backpropagation
utiliza una función o superficie de error asociada a la red, buscando el estado de mínimo
error estable a través del camino descendente de la superficie de error [Rumelhart,
1986]. Es por esto que de debe realizar la retroalimentación para realizar las
modificaciones en los pesos en un valor proporcional al gradiente decreciente de dicha
función de error. En la Figura 2.5 se puede ver un esquema de este tipo de redes
neuronales artificiales.

Entrada 1 N1 j
NO 1
1
NO 1
Entrada 2 N2 j
NO 2
1 S1 Salida 1
NO 2
Entrada 3 N3 j
NO 3
1
Entrada 4 NO 3 Salida m
Sm
N4 j
NO 4
1
NO i
Entrada n Nn j
NO k
Capa Oculta 1 Capa Oculta j
Capa de Capas de Neuronas Ocultas Capa de

Entrada Salida
Figura 2.5: Modelo Backpropagation [Rumelhart et al., 1986] de red neuronal artificial (NN). Es una red
multicapa, con conexiones hacia adelante y sin coneciones recurrentes.
2.2.3.1 – Funcionamiento de las redes Backpropagation
Dada una neurona Ui y su salida Yi, el cambio que se produce en el peso de la conexión
que une la salida de dicha neurona con la unidad Uj(wij) para un patrón de aprendizaje p
es:
Pk = [a 1(k) , a (k) (k) (k) (k)
2 , a 3 ,..., a n , s n ] (2.9)
Dwij (t + 1) = a × d pj × Y pi (2.10)
Donde el subíndice p se refiere al patrón de aprendizaje concreto y α es la constante o

tasa de aprendizaje. La regla delta generalizada difiere con la regla delta en el valor
concreto de δpj. En las redes con capas ocultas como esta se desconocen las salidas
internas deseadas de las capas para poder calcular los pesos en función del error
cometido. Sin embargo, inicialmente podemos conocer la salida deseada de las neuronas
de salida. Para la unidad Uj de salida, se define:
d pj = (d pj - Y pj )× f ' (Net j ) (2.11)
Donde dpj es la salida deseada de la red para la neurona j y el patrón p y Netj es la

entrada neta de la neurona j. Si Uj pertenece a una de las capas ocultas o entradas, se
tiene:
æ N ö
d pj = ç å d pk × wkj ÷ × f ' (Net j ) (2.12)
è K =1 ø
Donde el rango de k cubre todas las neuronas a las que está conectada la salida de Uj y
el error que se produce en una neurona oculta es la suma de todos los errores cometidos

por las neuronas a las que está conectada su salida, multiplicados por el peso de la
conexión correspondiente.
Se puede adicionar un momento β a la regla delta generalizada para determinar el efecto

en el paso (t+1) del cambio de los pesos en el instante (t). Esto permite la convergencia
de la red en menor número de iteraciones, ya que si en (t) el incremento de un peso es
positivo y en (t+1) también es positivo, entonces el descenso por la superficie de error
en (t+1) es mayor.
Sin embargo, si en (t) el incremento es positivo y en instante (t+1) es negativo, se ha

pasado por un mínimo y los pesos deben ser menores para poder alcanzarlo, por lo
tanto, el paso que se da en el instante (t+1) será más pequeño.
Dwij (t + 1) = a × d pj × Y pi + b (wij (t ) - wij (t - 1)) (2.13)
Donde β es una constante que determina el efecto en la iteración (t+1) del cambio de los
pesos en la iteración (t). Esto permite la convergencia de la red en menor número de
iteraciones.
2.2.3.2 – Entrenamiento de las redes Backpropagation
1. Se inicializan los pesos de la red con valores aleatorios w0, que pueden estar
entre 0 £ w0 £ z £ 1. 11
2. Se presenta un patrón de entrada: Pk = [a 1(k) , a (k) (k) (k) (k)

2 , a 3 ,..., a n , s n ] y se especifica
la salida deseada: s (k)

n .
3. Se calcula la salida de la red con respecto al patrón de entrada, se calculan las

salidas que presentan cada una de las capas ocultas hasta llegar a la capa de
salida, produciendo Yk = [y1(k) , y (k) (k) (k)
2 , y 3 ,..., y n ] . Para ello se procede desde la
capa de entrada hacia las capas ocultas calculando las entradas netas de las
neuronas, sin incluir las de la capa de entrada que reciben los datos y se calculan
las salidas de las neuronas ocultas:
N
Net hpj = å wijj × x pi + Q hj (2.14)
i =1
(
y pk = f jh Net hpj ) (2.15)
Donde el índice h se refiere a magnitudes de una capa cualquiera de la red

neuronal salvo la capa de entrada (capas ocultas y capa de salida), el subíndice p
al vector de entrenamiento, y j a la j-ésima neurona oculta.
11
z es un valor determinado por el usuario que debe ser menor que 1 y representa el valor umbral de los
pesos aleatorios de la conexiones de la red.

4. Se calcula el error para todas las neuronas de la red: Si la neurona pertenece a

una capa de salida el valor de delta es proporcional a la diferencia entre el valor
resultante y el valor esperado (2.16); mientras que si es de una capa oculta, su
valor depende de todos los términos de error de la capa de salida (2.17). Aquí
puede verse la retropropagación del método.
d pj = (d pj - Y pj )× f ' (Net j ) (2.16)
æ ö
d pj = ç å d pk × wkj ÷ × f ' (Net j )
N
(2.17)
è K =1 ø
En ambos casos, la función de activación utilizada en cada una de las neuronas
debe ser derivable de primer orden. Se continuará el desarrollo del método de
Backpropagation utilizando la función Sigmoidal (11), que será utilizada en esta
tesis y es apta para salidas binarias.
f k (Net jk ) =
1
Net jk (2.18)
1- e
Por lo tanto, si se utiliza la función Sigmoidal como función de activación de las
neuronas se puede calcular el error de las neuronas de las capas ocultas:
æ ö
d pj = x pi (1 - x pi ) × ç å d pk × wkj ÷
N
(2.19)
è K=A ø
Entonces el error que se produce en una neurona oculta j es proporcional a la
suma de los errores conocidos que se producen en las neuronas a las que j está
conectada, multiplicadas por el peso de la conexión. Como las conexiones en
una red del tipo Backpropagation son solo hacia delante, los errores que influyen
son los de las neuronas K que se encuentran en la capa siguiente más cercana a
la salida (desde la A hasta la N).
5. Se actualizan los pesos con respecto al porcentaje de error que se ha detectado

para cada una de las neuronas adicionando el momento β a la regla delta
generalizada para acelerar el proceso de aprendizaje. Se utiliza (2.20) para las
neuronas de la capa de salida y (2.21) para las neuronas de la capa oculta
Dwij (t + 1) = a × d pj × Y pi + b (wij (t ) - wij (t - 1)) (2.20)
Dwij (t + 1) = a × d pj × x pi + b (wij (t ) - wij (t - 1)) (2.21)
6. Este proceso se repite una cantidad fija de veces o hasta lograr que el error
promedio de clasificación de la red sea aceptable [García-Martínez, 2003].
Puede existir el caso para el cual la cantidad de neuronas en las capas ocultas
sean insuficientes para reconocer los patrones de entrada con un error aceptable,
en tal caso debe modificarse la topología de la red para poder reconocer los
patrones mas complejos.
N
E p = 1 2 × å d pk
2
(2.22)
k =1

2.2.4 – Redes Self Organizing Maps (S.O.M.) [Kohonen, 2001]
Existen evidencias que demuestran que las neuronas del cerebro se organizan en varias
zonas, donde la información captada del entorno, por los órganos sensoriales y se
representa internamente en forma de mapas bidimensionales. Si bien esta organización
puede estar predeterminada genéticamente, esto sugiere que el cerebro podría poseer la
capacidad de formar mapas topológicos de las informaciones recibidas del exterior. Esto
le brinda la capacidad de operar con elementos semánticos ya que algunas de sus áreas
simplemente podrían ordenar neuronas especializadas con características de alto nivel
construyendo mapas espaciales para atributos y características. En esto se basa Teuvo
Kohonen [Kohonen, 2001] quien en 1982 presentó un modelo de red neuronal con
capacidad para formar mapas de características. Kohonen plantea que un estímulo
externo por sí solo es suficiente para forzar la formación de los mapas y establecer
características comunes entre los datos de entrada a la red y su salida.
Los mapas autoorganizados de Kohonen o redes neuronales S.O.M. (Self Organizing

Maps) imitan el funcionamiento de las neuronas biológicas y forman mapas de
características. Existen variantes del modelo presentado por Kohonen:
· Learning Vector Quantization (L.V.Q.).

· Topologic Preserving Map (T.P.M.) o Self Organizing Map (S.O.M.).
Las redes S.O.M. son modelos de redes con conexiones hacia delante (feedforward), y
conexiones laterales de inhibición (w £ 0) implícitas, para que cada una de las neuronas
de salida tenga influencia sobre sus vecinas. Esto es necesario para el entrenamiento,
donde solo una de las neuronas de salida se activará dado un vector p de atributos en la
capa de entrada. El entrenamiento es del tipo no supervisado y competitivo, utilizando
la técnica “Winner Takes All” o “el ganador se lleva todo”. Las redes deben ser
entrenadas Off-Line y luego, con los pesos de todas las conexiones fijos, puede ponerse
en funcionamiento normal. En la Figura 2.6 se ve un esquema de este tipo de redes:
Entrada 1 E1
Sn
Salida 1
Entrada 2 E2
S1
Salida 2
Entrada 3 E3
Sm
Salida m
Entrada 4 En
Capa de Entrada Capa de Salida
Figura 2.6: Modelo S.O.M. [Kohonen, 2001] de red neuronal artificial (NN). Es una red multicapa, con
conexiones hacia adelante y con conexiones recurrentes.

2.2.4.1 – Entrenamiento de las redes S.O.M.
Los pasos a seguir para el entrenamiento de las redes del tipo S.O.M. son:
1. Se inicializan los pesos de la red con valores aleatorios w0, que pueden estar
entre 0 £ w0 £ z £ 1. 12
2. Se presenta un patrón de entrada Pk = [a 1(k) , a (k) (k) (k)

2 , a 3 ,..., a n ] sin especificar
ninguna salida deseada.
3. Las neurona j no solo recibe los datos pertenecientes al patrón P de entrada, sino
que también recibe la influencia de las conexiones laterales, cuyo valor Int es
una función que dependerá a la distancia a la que se encuentra j del resto de las
neuronas P (se suele utilizar funciones del tipo sombrero mejicano para
representar la influencia de la neurona p sobre la neurona j). La ecuación 2.23
representa el estado de la salida de la neurona j en el instante t+1.
æ N M ö
S j (t + 1) = f çç å wij × a i( k ) + å Int pj × S p (t ) ÷÷ (2.23)
è i =1 p =1 ø
4. Se encuentra ahora la neurona de salida vencedora como aquella cuyo vector de
pesos wj se asemeje más al patrón de entrada Pk. Puede utilizarse tanto la
distancia euclídea como la misma ecuación al cuadrado, lo importante es
encontrar la menor diferencia entre el peso wij de la neurona j y el
correspondiente elemento del patrón de entrada a i(k) que es componente i-ésimo
del k-ésimo patrón de entrada. La ecuación 2.24 representa el concepto de
“winner takes all” donde solo una neurona se activa al finalizar las iteraciones.
ì æ ö
å (a )
N
ï1 MIN Pk - W j = MIN ç 2 ÷
2
(k)
- wij
Sj =í ç 1 ÷ (2.24)
è i =1 ø
ï
î0 " otra Neurona
5. Una vez que se encuentra la neurona vencedora J* se actualizan los pesos de las
neuronas cercanas para crear el mapa autoorganizado asociando la información
con cierta zona de la capa de salida, llamada Zonaj*. Como en las demás redes a
es el coeficiente de aprendizaje asociado a la red que puede hacerse variar según
alguna de las opciones mostradas en las ecuaciones 2.26.
(
wij (t + 1) = wij (t ) × a (t ) × a 1(k) - w j * (t ) ) (2.25)
1 t
a (t ) = Ú a (t ) = 1 - (2.26)
t Tmax
12
z es un valor determinado por el usuario que debe ser menor que 1 y representa el valor umbral de los
pesos aleatorios de la conexiones de la red.

2.2.4.2 – Parámetros de las Redes S.O.M.
No es suficiente configurar las características de las redes S.O.M., se debe proveer de

datos para el entrenamiento y la validación de los resultados. También se deben
configurar parámetros adicionales, de manera experimental (ya que los valores óptimos
dependen de los valores ingresados como datos) para lograr la mejor clasificación. Los
parámetros de las redes neuronales S.O.M. a configurar son:
· La cantidad de Neuronas Artificiales: Las redes S.O.M. generan una grilla de

clusters de [n x n], donde n es la cantidad de neuronas de que consta la red. Este
parámetro es fundamental ya que determina la cantidad de clusters que se
pueden generar. Por ejemplo, para una red de n neuronas artificiales se pueden
generar n2 clusters o familias de datos.
El valor mínimo de n es dos, ya que una sola neurona carecería de sentido

(porque forma un único cluster que englobará todos los datos) mientras que el
valor máximo no está acotado por el algoritmo, pero éste intentará crear la
menor cantidad posible de clusters para los datos de entrada, con lo que el uso
de, por ejemplo, diez neuronas artificiales para los datos con grupos muy
evidentes puede generar solamente dos o tres clusters, desperdiciando la
clasificación de los restantes 97. Se observa además, que cuanto mayor es la
cantidad de neuronas, el tiempo que insume su entrenamiento es cada vez
mayor.
· La cantidad de Ciclos: Un ciclo consiste en presentarle a la red neuronal (en la

etapa de entrenamiento) todos los datos relevados exactamente una vez. Como la
red está constantemente en un período de aprendizaje, una vez que se le presenta
el dato n+1, los valores de los pesos que se utilizaron para clasificar el dato n se
pueden ver modificados, por lo que se requiere que la información sea
presentada más de una vez para que la red almacene la clasificación de todos los
datos, mientras continúa clasificando correctamente a los datos ya ingresados.
El número mínimo de veces que se le pueden presentar las observaciones a la

red es solo una, mientras que no existe un limite máximo, pero como el tiempo
que insume el período de aprendizaje es muy elevado, repetirlo muchas veces
puede llevar días, incluso en los casos con pocos datos relevados.
A lo largo de las distintas iteraciones que proporcionan los ciclos, por medio del
aprendizaje no supervisado, la red puede modificar la clasificación del elemento
k-ésimo del ciclo i-ésimo al ciclo i-ésimo+1. Con esto se lograrán agrupaciones o
familias de elementos mucho mas acertadas. En la práctica, para la mayoría de
los casos, se logra un valor de convergencia C, que si se supera no modificará la
clasificación de los elementos predicha por la red. En la Figura 2.7 se puede
observar la influencia de la cantidad ciclos en el entrenamiento de la red. La
figura muestra como una red o malla (donde cada unión del polígono es
determinada por una red S.O.M.) se puede ajustar a una región bidimensional
(en este caso de forma triangular). Se comienza con los pesos asignados en
forma aleatoria, pero como se puede ver, de la Figura 2.7.f a la 2.7.h existen
75.000 ciclos de entrenamiento y las diferencias en el modelo final son mínimas.

Figura 2.7.a Figura 2.7.b Figura 2.7.b Figura 2.7.d
Figura 2.7.e Figura 2.7.f Figura 2.7.g Figura 2.7.h

Figura 2.7: Pasaje de una grilla de 3 dimensiones a una región patrón del tipo triángulo equilátero en el
plano utilizando un mapa de 25x25 puntos y una red del tipo S.O.M. Se muestran los resultados para las
iteraciones 20 (2.7.a), 250 (2.7.b), 500 (2.7.c), 1000 (2.7.d), 10000 (2.7.e), 25000 (2.7.f), 50000 (2.7.g) y
100000 (2.7.h).13
· Aleatoriedad: En cada ciclo, las observaciones que son presentadas una vez,
pueden ser tomadas en orden secuencial o en orden aleatorio. Si se selecciona el
orden aleatorio, el elemento original en la posición I de la grilla de entrada no
sólo será presentado aleatoriamente en una nueva posición J en la primera
iteración, sino que en la iteración posterior, será presentado en la posición K
(con K muy probablemente14 distinto de J), y así sucesivamente, modificando su
posición de presentación en cada una de las iteraciones precedentes.
· Parámetro de aprendizaje: Como se menciona en el Estado del Arte, sección

2.2.3.5.2.1 – Entrenamiento de las redes S.O.M., el parámetro de aprendizaje
a(t) hace referencia a la proporción del error dij que se utilizará para modificar
el peso de la conexión entre la neurona i y la neurona j. En este caso en
particular, los valores están acotados en el intervalo 0 < a(t) < 1 por una
característica intrínseca de las redes S.O.M (ver Estado del Arte, sección
2.2.3.5.2 – Redes S.O.M.). y a medida que el entrenamiento de la red neuronal
progresa, el parámetro de aprendizaje decrece desde su valor inicial hasta su
valor final.
13
Gráfico generado por el autor de la tesis con la aplicación WSOM de Christian Borgelt.
14
Dado que la distribución de probabilidad que se utiliza para seleccionar los datos es uniforme, todos los
elementos restantes del conjunto inicial tienen la misma probabilidad de ser elegidos para ser el próximo
dato a presentar a la red. Se puede calcular la probabilidad de un elemento que en la iteración i-ésima un
salió en la posición K, en la iteración i-ésima+1 este vuelva a salir en la posición K. El caso más simple
es para el primer elemento a presentar a la red en la iteración iesima, para el cual la probabilidad de salir
en la misma posición en la próxima iteración esta dada por:
1 1
P (0 ) = ¾reemplazan
¾ ¾¾ ¾do
® = 0,0082645
Cant . Elem. Re s tan tes 121

· Sigma para el vecindario Gaussiano: Como se menciona en el Estado del

Arte, sección 2.2.3.5.2.1 – Entrenamiento de las redes S.O.M., es el parámetro
que determina la influencia entre una neurona y las neuronas vecinas. Las redes
S.O.M. son modelos de redes con conexiones hacia delante (feedforward),
existiendo conexiones laterales de inhibición (w£0) implícitas, para que cada
una de las neuronas de salida tenga influencia sobre sus vecinas. Por lo tanto, la
neurona j no solo recibirá los datos pertenecientes al patrón de entrada P, sino
que también recibirá la influencia de las conexiones laterales, cuyo valor Int es
una función que dependerá a la distancia a la que se encuentre j del resto de las
neuronas. Los valores permitidos para sigma están en el intervalo 0% £ s £
100%.
De manera similar al parámetro de aprendizaje, sigma para el vecindario

gaussiano decrece a medida que el entrenamiento de la red neuronal progresa,
desde su valor planteado como parámetro inicial hasta su valor final, que
también debe ser configurado para el funcionamiento correcto de la red.
La mayoría de estos parámetros surgen a través de un proceso iterativo, donde se

entrena la red y luego se analizan los resultados. Si los resultados son satisfactorios (es
decir, el error de entrenamiento es lo suficientemente pequeño), solo se modifican
levemente los parámetros para intentar mejorarlos aún más. Si los resultados son poco
satisfactorios, se modifican en un valor más elevado, hasta obtener los valores que
mejor se adaptan a las necesidades de la aplicación.
2.2.5 – Campos de Aplicación
Los campos de aplicación de las redes neuronales artificiales son variados y están
planteados en distintos trabajos de investigación, como el desarrollado Cinca y Gallizo
Larraz. Una clasificación de los tipos de aplicaciones de las redes puede ser:
· Para optimización: Determinan la solución de un problema tal que sea

aceptable. Generalmente, se aplican redes retroalimentadas como la de Hopfield
[Hopfield, 1982; Fausett, 1994] y se utilizan en campos como el manejo de
niveles de tesorería, existencias, producción, etc.
· Para reconocimiento: En este caso se entrena a las redes para lograr detectar
patrones específicos, como pueden ser sonidos, números, letras, lenguaje
humano escrito en general y representar el resultado en código ASCII,
UNICODE o cualquier otro.
· Para generalización: Se entrena la red con casos reales y después se la utiliza

para evaluar casos futuros. Especialmente se la utiliza en la clasificación
(clustering) o predicción de un elemento nuevo dentro de grupos existentes.
La Tabla 2.2 resume los campos de utilización de las redes neuronales artificiales con
éxito.

Campo de aplicación Aplicación Especifica

Detección de fraudes
Ciencias Económicas Predicción de quiebras bancarias
Análisis del mercado de capitales
Análisis en tendencias del mercado
Clasificación de señales de radar
Organismos Militares Diseño de armas Inteligentes
Reconocimiento de trayectorias balísticas
Tendencias y patrones climáticos
Medio Ambiente
Previsión del clima
Previsión de la evolución de los precios
Finanzas Valoración del riesgo de los créditos
Identificación de falsificaciones
Determinación del ECG fetal
Medicina Clasificación de células cancerosas
Diseño de prótesis electrónicas
Reconocimiento de patrones
Reconocimiento de caracteres
Procesamiento de Imágenes Extracción de contornos
Compresión de la información con pérdida
Reconocimiento de elementos
Tabla 2.2: Campos de aplicación de las redes neuronales artificiales
Se puede agregar, a modo de ejemplo, más campos a la Tabla 2.2, como lo son las
apuestas y los juegos de azar, donde se debe analizar para determinar las cotizaciones o
premios de las distintas opciones; en la agricultura para detectar, por medio de
procesamiento de imágenes, frutas y hortalizas en mal estado; en química, para
identificar estructuras cristalinas de proteínas que se encuentran en imágenes de
microscopio electrónico y en la industria en general, para los procesos de obtención de
hierro y acero, manejo de stocks etc. la lista se extiende a muchos campos más que no
vale la pena exponer aquí. En la Tabla 2.3 se exponen las principales topologías de
redes, los investigadores que las desarrollaron y su fecha de aparición.
Año Topología Investigador/es

1943 Primer modelo de redes neuronales artificiales. Warren McCulloch Walter Pitts
1949 Organización del Comportamiento Donald Hebb
1954 Proyecto Dartmouth Farley, Clark, Rochester, Holland
1957 Perceptron, aprendizaje supervisado y refuerzo Rosenblatt, Bellman
1959 AD/MADALINE, primera aplicación de ANN. Bernard Widrow, Marcian Hoff
1969 Libro “perceptrons” Marvin Minsky, Seymour Papert
1972 Técnicas Asociativas Anderson, Kohonen, Klopf
1974 Algoritmo de Backpropagation Webros
1975 Cognitron: la primera red multicapa Kunihiko Fukushima
1973 Postulados de aprendizaje de Hebb G. S. Stent, Danchin, Changuex
1976 Self Organising Map (S.O.M.) Willshaw, Von der Malsburg, Grossberg
1982 Self organizing feature mapping (S.O.F.M.) Kohonen
1982 Limitaciones y habilidades de AAN. Hopfield
1982 Funciones de energía y temperatura (estadística). Hopfield, Grossberg, Amit
1985 Algoritmo de Backpropagation mejorado Parker, LeCun
1986 Procesamiento paralelo RumelHart, McClelland
1988 Noción del “espacio” en las redes neuronales. Gardner, Amari
1983 Boltzman Machine Hinton, Sejonwski
1995 Mapas computacionales en la corteza visual. Erwin
Tabla 2.3: Topologias de redes e hitos ordenados cronológicamente.

2.3 – Sistemas Tutores Inteligentes
Guardia Robles [Guardia Robles, 1993] resume un conjunto de características que

deben cumplir todos los Sistemas Tutores Inteligentes (STI):
· Deben ser “inteligentes” en comparación con los sistemas tradicionales de

instrucción por computadora (CAI), siendo el diferencial de inteligencia los
métodos de la rama de la Inteligencia Artificial (IA).
· Deben poseer la capacidad tanto para resolver el problema que se le presenta a

un estudiante como también la capacidad de explicar como lo resolvió.
· Como en los CAI tradicionales, permiten una mayor individualización en la

instrucción, llegando más lejos, a través del entendimiento de las metas y
creencias del estudiante.
· Se usan técnicas de Inteligencia Artificial para planeación, optimización y

búsquedas, dejando que el sistema decida el orden de presentación del contenido
al alumno.
· La interacción puede ser muy variada en un STI: desde sistemas pasivos (que
esperan para que el alumno realice una acción), hasta los que constantemente
presentan nueva información (tutor oportunista), con casos intermedios en los
que se enseña un concepto en un momento determinado o solo cuando el alumno
lo pide.
· Utilizan nuevas tecnologías, con los ejemplos de interfaces orientadas a la

utilización de multimedia y del WWW.
· No basta con indicarle un error al estudiante, el sistema debe hacer hipótesis

basadas en el historial de errores del alumno y detectar la fuente del problema.
Con estas consideraciones en mente, Guardia Robles [Guardia Robles, 1993] presenta
una definición para los tutores inteligentes: “Un Sistema Tutor Inteligente es un sistema
de enseñanza asistida por computadora, que utiliza técnicas de Inteligencia Artificial,
principalmente para representar el conocimiento y dirigir una estrategia de enseñanza;
y es capaz de comportarse como un experto, tanto en el dominio del conocimiento que
enseña (mostrando al alumno cómo aplicar dicho conocimiento), como en el dominio
pedagógico, donde es capaz de diagnosticar la situación en la que se encuentra el
estudiante y de acuerdo a ello ofrecer una acción o solución que le permita progresar
en el aprendizaje.”
Villareal [Villareal, 2003] plantea que los Sistemas Tutores Inteligentes (STI) simulan a
un tutor autoritario que posee una estrategia de enseñanza de los conceptos del dominio
del tipo uno a uno. Además es un experto en un dominio de conocimiento determinado
y actúa como guía, tutor o entrenador. Este tutor debe poder adaptarse a las necesidades,
que surgen a lo largo de la interacción en una sesión de tutelado, del estudiante alumno.

2.3.1 – Arquitectura y Componentes
Los Sistemas Tutores Inteligentes (STI) tienen como principal objetivo impartir la
enseñanza de un contenido dado un dominio en la forma más adecuada a las
necesidades individuales del alumno. Estos sistemas se basan en una arquitectura
compuesta por tres grandes módulos: el módulo del tutor, el módulo del alumno y el
módulo del dominio [Villareal et al., 2001]. Podría agregarse un cuarto módulo
denominado el módulo de evaluación y, un quinto denominado módulo de interface y el
ecosistema propuesto por Cataldi [Cataldi, 2004].
1. Módulo del Alumno: Este módulo debe representar el estado inicial del alumno
y sus características individuales, entre ellas una de las más importantes es el
conocimiento individual instantáneo sobre el dominio [Villareal Goulart et al.,
2001]. Guardia Robles [Guardia Robles, 1993] lo define como: “El modelo del
estudiante, que refleja cuánto conoce el estudiante sobre el dominio, así como
las experiencias cognitivas y de aprendizaje que ha llevado, del cual puede
obtenerse un diagnóstico.”
2. Módulo del Tutor: Este módulo posee el conocimiento sobre las estrategias y
tácticas de enseñanza para poder seleccionarlas en función de las características
del alumno, que están almacenadas en el modulo del alumno [Villareal Goulart
et al., 2001]. Pero debe ir más allá de la experiencia en el dominio, ya que debe
ofrecer a cada estudiante un método de enseñanza de acuerdo con sus
necesidades.
3. Módulo del Dominio: Este módulo posee el conocimiento de la materia

formado por las reglas de producción, estereotipos, etc. De aquí el módulo tutor
obtiene el conocimiento que debe enseñar [Villareal Goulart et al., 2001].
Definido como “El modelo experto o del dominio, el cual versa sobre la materia
o curso que se impartirá” [Guardia Robles, 1993].
4. Módulo de Evaluación: Se encarga de realizar una evaluación general del

sistema y generar estadísticas acerca de los avances de los estudiantes; pudiendo
efectuar el diagnóstico evolutivo luego de cada uno de los estados considerados,
de este modo podría también predecir el comportamiento en los eventos futuros.
La evaluación de los estudiantes debe ser constante y durante la carga del
proceso, con instancias de autoevaluación. También se deberán generar informes
a utilizar para evaluar al sistema como método apto de enseñanza.
5. Módulo de Interface: Es la interface de interacción entre el STI y el alumno

real, que se encarga de presentar el material del dominio y cualquier otro
elemento didáctico de la manera correcta [Villareal Goulart et al., 2001]. “La
interface, que permite a los usuarios interactuar con el sistema. Se distinguen
tres tipos específicos de usuarios: el Estudiante, el Instructor, y el
Desarrollador del sistema.”[Guardia Robles, 1993]. Para su diseño pueden
seguirse los criterios ergonómicos basado en el estándar ISO 9241 para Human
Computer Interface (HCI) u otros similares.

Los primeros tres módulos conforman la arquitectura clásica propuesta por Carbonell
[Carbonell, 1970] y también funcional de los STI [Villareal Goulart et al., 2001] se
pueden ver en la Figura 2.8. Esta postura presentó grandes avances en el modelado de
ambientes educativos, ya que separó el dominio de la forma en la que éste es utilizado
[Villareal Goulart et al., 2001].
Sistema Tutor Inteligente
Modulo Dominio Modulo Tutor Modulo Estudiante
Interfaz
Figura 2.8: Estructura clásica de un Sistema Tutor Inteligente propuesta por Carbonell [Carbonell, 1970].
Existen visiones no clásicas de los Sistemas Tutores Inteligentes (STI), como lo es la

propuesta de arquitectura general en Clancey [Clancey, 1991] la cual puede resumirse
de la siguiente manera:
· Son dos sistemas expertos: Uno encargado de diagnosticar el estado actual del
alumno y otro encargado de decidir la mejor forma de retroalimentarlo en el
momento actual, cumpliendo el rol de asesor.
· Poseen un sistema experto de diagnóstico: Con un algoritmo de decisión sobre

la mejor estrategia de retroalimentación, basado en una representación del
conocimiento sobre el estado cognitivo del alumno.
2.3.2 – Módulo del Alumno
El diseño del modelo del estudiante se centra, según Barr [Barr et al., 1983] alrededor
de las preguntas: ¿Qué es lo que se desea que el estudiante sepa acerca del mecanismo
de resolución de una problemática? Qué tipos de conocimientos debe tener un
estudiante para poder resolver un problema de operación o reparación del
mecanismo?. De manera que el módulo del estudiante deberá tener conocimientos
acerca de [Sierra et al., 2003]:
· Los componentes del mecanismo para la resolución de un problema.

· La operación de los componentes del mecanismo.
· La interrelación entre los componentes del mecanismo.
· La operación del mecanismo.
Si un estudiante elige examinar un componente en particular, entonces se asume que el

estudiante conoce algo acerca del componente. Dado el contexto del problema, la
selección de un componente es de algún modo una confirmación o no, de que el
estudiante comprende lo que el componente hace y cómo se relaciona con otros
componentes en la operación del mecanismo. Es decir que cada vez que el estudiante
chequea, manipula o examina un componente, indica de algún modo lo que él conoce o
desconoce acerca de la operación del mecanismo.

La función central del módulo del estudiante, para Sierra [Sierra et al., 2003] se puede
resumir en el siguiente párrafo: “Para realizar inferencias acerca de lo que el
estudiante conoce, es necesario interpretar o hacer presunciones en base a las acciones
del estudiante. Estas interpretaciones constituyen la parte central en el desarrollo del
modelo del estudiante en el diseño de un Sistema Tutor Inteligente.”
Por lo tanto, es importante conocer el estado y el estilo de aprendizaje de cada uno de

los alumnos para que el módulo tutor pueda tomar las decisiones pedagógicas correctas.
Ésta es una de las salidas más importantes del módulo del alumno y una de las entradas
del módulo tutor. El módulo tutor, luego, realimentará las técnicas utilizadas, los temas
expuestos en el dominio y los resultados obtenidos para que se pueda actualizar la
representación del estado del conocimiento del alumno.
2.3.2.1 – Estilos de Aprendizaje
El estilo de aprendizaje puede definirse como la forma en que un individuo aprende, y

debido a que las personas tienen diferentes estilos de aprendizaje, éstos se reflejan las
diferentes habilidades, intereses, debilidades y fortalezas académicas [Figueroa et al.,
2004]. Diferentes investigadores [Felder, 1998] presentan distintas formas para
reconocer los estilos de aprendizaje de los estudiantes.
Una definición de los estilos de aprendizaje puede plantearse como “los rasgos
cognitivos, afectivos y fisiológicos que sirven como indicadores relativamente estables,
de cómo los alumnos perciben interacciones y responden a sus ambientes de
aprendizaje [Keefe, 1988]. Por lo tanto se requiere una variedad de mediciones para
evaluar los estilos de aprendizaje de los distintos estudiantes y determinar su potencial
de éxito en una carrera de Ingeniería [Figueroa et al., 2004].
La mayoría de los autores idearon instrumentos para la detección de los estilos de

aprendizaje de los alumnos. En la siguiente sección se detallan las herramientas
utilizadas para la toma de datos necesarios para la verificación de las diferentes
hipótesis planteadas en esta tesis.
2.3.2.2 – Planilla de Estilos de Aprendizaje
A continuación se muestra la plantilla de estilos de aprendizaje que se utilizó para la

recolección de los datos de los estudiantes. Estas planillas están confeccionadas por
once grupos de cuatro preguntas cada uno. Cada pregunta está orientada para clasificar
al estudiante en los distintos grupos resultantes de la clasificación de Felder [Felder,
1998], que son:
· Tareas activas – Tareas de reflexión: Forma de procesar la información.
· Sensorial – Intuitiva (racional): Forma de percibir la información.
· Visual – Verbal: Forma de presentar la información.
· Secuencial – Global: Forma del proceso del aprendizaje.

La información que se busca no está relacionada directamente con las formas que
describe Felder, sino que se busca la relación de los estilos de aprendizaje con los
modos de enseñanza o protocolo pedagógico para las sesiones pedagógicas con el
estudiante.
La planilla utilizada consta de once grupos de cuatro preguntas cada uno con dos
opciones de respuestas, así como también de datos adicionales que ayudaran a
categorizar a los estudiantes. Estos datos son:
· Carrera: Se refiere a la carrera que el estudiante esta cursando actualmente.
· Universidad: La institución donde cursa la carrera mencionada.
· Año de ingreso: Es el año en la que comenzó el ciclo básico o similar.
· Año que cursa: Según el plan de estudios vigente para la carrera seleccionada.
· Edad: Del estudiante.
· Sexo: Femenino o masculino.
Las planillas son anónimas en este punto del desarrollo, una vez categorizadas y
realizada la inferencia para determinar los estilos pedagógicos más efectivos para los
estudiantes, es decir que cada estudiante pueda seleccionarlo de acuerdo a su
preferencia. Un usuario del Sistema Tutor Inteligente (STI) deberá llenar por primera
vez la planilla para que el sistema realice una categorización inicial que luego podrá
llegar a ser modificada a lo largo del tiempo por el comportamiento del estudiante
dentro del sistema. Los estudiantes deben entregar la planilla con su nombre y número
de padrón, pero en esta etapa del análisis se ignorará este dato.
En la Figura 1.1 se pueden ver las preguntas utilizadas para el relevamiento de los 121
estudiantes (la justificación del tamaño muestral se encuentra en la sección 5.3.2
Validación del modelo).
Se utilizaron planillas de estilos de aprendizaje para la toma de datos en distintas

materias del área de Programación Básica de la Facultad de Ingeniería de la Universidad
de Buenos Aires para asegurar:
· La diversidad: De esta manera se obtienen datos de las cada una de las 10

carreras que se cursan en la Facultad de Ingeniería de la Universidad de Buenos
Aires, estas carreras son:
o Carreras de Grado
Ingeniería Civil Ingeniería Electricista
Ingeniería Industrial Ingeniería Química
Ingeniería Naval y Mecánica Ingeniería en Informática
Ingeniería Mecánica Ingeniería de Alimentos
o Carreras de menor duración
Agrimensura Licenciatura en Análisis de Sistemas

De esta manera se toma una muestra que representativa de todas las carreras de la
Facultad y se evita que por la selección de individuos de una misma carrera, la
población sea extremadamente homogénea.
· La cantidad: Realizando observaciones en las materias Algoritmos y

Programación I y Computación se logra aumentar el número de planillas que se
pueden utilizar para el entrenamiento de la red S.O.M. La materia Algoritmos y
Programación I permite obtener datos de las carreras: Ingeniería en Informática y
Licenciatura en Análisis de Sistemas ya que es un curso común, mientras que de la
materia Computación se obtienen los datos de las materias Ingeniería Civil,
Ingeniería Industrial, Ingeniería Naval y Mecánica, Ingeniería Mecánica,
Ingeniería Electricista, Ingeniería Química, Ingeniería de Alimentos y
Agrimensura, que también es un curso común.
· Diferencia de esquemas mentales: A través de los estilos de aprendizaje de trata

de evidenciar si los estudiantes de las distintas carreras poseen diferentes
características para resolver problemas similares. Es decir, se plantea si todos los
estudiantes de Ingeniería (independientemente de la carrera en particular) poseen
características de enseñanza similares, o si estas varían entre cada una de las
diferentes carreras.
La planilla es entregada a los estudiantes en una hoja doble faz y se les concede el
tiempo que necesario para completar todas las preguntas de la encuesta. Una vez
recolectadas las encuestas estas son procesadas por el tesista y llevadas a un medio
digital utilizando la codificación que se puede observar en la sección A.2 – Planillas de
estilos de aprendizaje del Anexo A o los datos sin codificar como pueden observarse en
la sección A.3 – Valores de entrenamiento para la red S.O.M. del Anexo A.
El esquema de las planillas utilizada en la experiencia se muestra en la Figura 2.9, en

donde se pueden ver los datos comunes: Carrera, Universidad, Año de Ingreso, Año que
cursa, Edad y Sexo, y luego siguen las 44 preguntas para determinar el estilo de
aprendizaje del estudiante.


Figura 2.9: Planilla de estilos de aprendizaje utilizada, tomada de Felder [Felder, 1998].

2.3.2.3 – Rendimiento Académico de los Estudiantes
La planilla de rendimiento académico de los estudiantes, es simplemente una colección

de los resultados académicos a lo largo de un cuatrimestre para las materias de
Programación Básica relacionadas. Los nombres de los estudiantes no están completos
y solo se indican con el nombre de pila seguido por la inicial del apellido, para mantener
la confidencialidad de los datos. Este último comentario no modifica los resultados, ya
que esa información es de carácter informativo y no se la utiliza en el desarrollo
posterior de esta tesis. En la Tabla 2.4 se puede ver un ejemplo de cómo se obtienen los
datos del rendimiento académico de los distintos estudiantes utilizados para realizar la
experiencia. En la sección A.6 – Datos de los Cursos de Prueba del Anexo A se
presentan las planillas completas.
Evaluaciones Trabajos Evaluaciones

Parciales Recuperatorio Prácticos Integradoras
Recuperatorio
Primer Parcial
Práctico 1
Práctico 2
Trabajo
Trabajo
Final 1
Final 2
Final 3
Nombre y Apellido
1
(codificado)
Nicolás, A. 2 2 5 4 9 7 - -
Pablo Daniel, A. 2 6 - 4 9 4 - -
Roxana Maribel, A. 2 A 8 4 9 7 - -
Ignacio Pablo, A A 2 5 4 9 5 - -
Lucas Ariel B. 7 - - 4 9 5 - -
German B. 2 2 2 - - - - -
Tabla 2.4: Ejemplo de la planilla de resultado de los estudiantes.
2.3.3 – Módulo del Dominio
Para poder construir el modelo de un proceso, debe ser posible descomponerlo en sus
partes constitutivas. Es decir, el mecanismo a ser modelado debe tener partes
identificables en las cuales pueda ser descompuesto.
Por lo tanto para el caso del módulo del dominio, se debe descomponer el conocimiento
de los temas para los cuales el sistema deberá ser experto. Entre ellos se encuentra el
conocimiento dependiente del dominio, compuesto por las definiciones, los conceptos
fundamentales y las agrupaciones de conceptos que forman los temas. También existe el
conocimiento independiente del dominio, el cual se compondrá de los diferentes
parámetros del sistema que se requieren para el correcto funcionamiento del mismo y
por último se encuentran los elementos didácticos que se utilizan para mejorar y facilitar
la experiencia del proceso enseñanza/aprendizaje.

2.3.4 – Interface
La interface se encarga de presentar el contenido de la sesión de tutoría en forma

homogénea a lo largo de toda la curricula, presentando en tiempo y forma los elementos
pedagógicos que utiliza cada sesión, como pueden ser ejercitación, material multimedia,
texto, etc. Si bien la interface existe en todos los Sistemas Tutor Inteligente, no se la
considera un modulo fundamental, ya que se centra más en el aspecto grafico y no en
los contenidos.
Se puede generar una interface que responda a la adecuación del usuario, donde este
establezca parámetros, como la letra, el tamaño de la letra, el color de fondo, etc., para
crear un ambiente de trabajo donde se sienta más cómodo y mejorando la sesión
educativa. El diseño es muy importante para la interface, ya que depende en gran parte
de los usuarios.
2.3.5 – Módulos Externos: Evaluación y Registros Históricos
El sistema debe ser capaz de validarse, es decir, debe ser capaz de analizar el
desempeño que tuvo en las interacción con los alumnos y reorganizarse si su desempeño
fue inferior al esperado. Esta reorganización puede darse de forma automática, en
Sistemas Tutores Inteligentes (STI) más complejos, o en forma manual, modificando los
componentes que, dado el resultado de la evaluación, demostraron ser problemáticos o
estar pobremente adaptados a las situaciones a las que el sistema esta expuesto.
También el sistema debe se capaz de brindar los resultados de esta evaluación de forma
de informes, listados y datos procesados, para poder, por ejemplo, clusterizar los
alumnos en grupos definidos, detectar anormalidades o situaciones incorrectas, inferir
las causas y validar los datos obtenidos con el sistema en cursos pilotos, sin la
interacción del sistema, en los cuales se han tomados los mismos datos, para poder
verificar la mejora que resulta de la introducción del sistema tutor inteligente en el
ámbito educativo.
El sistema debe ser capaz de generar históricos de acuerdo a la solicitud del usuario y
debe poder mostrarlo de diferentes maneras. Estos módulos externos garantizan que el
funcionamiento del sistema pueda ser validado para nuevos casos de aplicación.
2.3.6 – Módulo del Tutor
2.3.6.1 – Introducción
La idea principal de este módulo es la de utilizar la computadora como “herramienta de

aprendizaje”, buscando automatizar el proceso de enseñanza [Villareal Goulart et al.,
2001]. Esto motivó los primeros esfuerzos en la década del sesenta en brindar soporte a
la los docentes. Desde aquella época hasta la actualidad se han realizado cambios en el
paradigma utilizado en la educación, partiendo de un estilo fuertemente conductista
hasta el día de hoy donde el concepto de “impartir” conocimientos es reemplazado por
el de “descubrir” o “construir” el conocimiento de forma significativa.

Por lo tanto, el software reproducía la forma de enseñanza que prevalecía en el sistema

educacional de esa época. Una parte del contenido del dominio era presentada en una o
más pantallas (orientadas solo a caracteres, sin gráficos u otros elementos didácticos) y
la interacción se limitaba a presionar la tecla Enter para cambar de pantalla. Esta forma
de enseñanza recibió el nombre de Computer Assisted Instruction (CAI).
Según Wenger [Wegner, 1987], la visión clásica del papel del módulo tutor es tomar las
decisiones pedagógicas en función de las interacciones con el alumno. Estas decisiones
derivan de reglas o estructuras de conocimiento que representan el conocimiento del
tutor con respecto al dominio y están representadas en forma definida en el sistema.
En los tutores clásicos, el criterio de control varía conforme a otro de optimización, y

suele ser una decisión de implementación, o sea, no existe cambio en la forma en la que
se controla la interacción. Algunos sistemas pueden monitorear las actividades de los
alumnos, adaptando sus acciones a las respuestas de los alumnos, pero nunca cediendo
el control de la interacción. Un ejemplo de este sistema es el CircSim [Kim, 1989; Kim,
2000; Cho, 2000; Hume, 1995; Shah, 1997; Hume et al., 1992].
Otra visión es la de García Martínez, compartida por Sierra [Sierra et al., 2003], donde
el módulo instruccional o módulo del tutor [Carbonell, 1970] es una representación de
los métodos que se usarán en el tutor inteligente para proveer información al estudiante.
Este modelo es complejo pues está pensado para dirigir al estudiante en su proceso de
aprendizaje y efectuar automáticamente ajustes en esta dirección a medida que el
estudiante progresa.
Para Sierra [Sierra et al., 2003] “En un sentido práctico, se tiene el siguiente problema
a resolver cuando se construye el módulo tutor de un Sistema Tutor Inteligente. El
estudiante está manipulando el modelo del dominio o mecanismo y el modelo de
estudiante está realizando inferencias en base a estas manipulaciones. El tutor debe
entonces hacer uso de esta información a efectos de proveer al estudiante con
información que sea útil para éste”. En su forma más general, a efectos de poder definir
correctamente la operación del módulo tutor, debe ser posible responder a las siguientes
preguntas: ¿Cuándo es necesario instruir? ¿Qué tipo de instrucción debe darse? Los
pasos metodológicos propuestos para el diseño del modelo del tutor son los siguientes
[Sierra et al., 2003]:
1. Analizar del modelo del estudiante a efectos de definir claramente cuáles son las
acciones que este puede llevar a cabo.
2. Interpretar adecuadamente las acciones definidas en el Paso 1 en función del tipo
de conocimiento que el estudiante debería poseer para llevar a cabo dichas
acciones en forma correcta.
3. En base a los diferentes tipos de conocimiento identificados en el paso 2,
determinar las estrategias de instrucción más apropiadas a fin que el estudiante
incorpore significativamente estos conocimientos a su estructura cognitiva.
En la década del setenta Carbonell [Carbonell, 1970] presentó una nueva postura, que
llevó a la práctica a través del sistema Scholar, donde tomó en consideración la forma
en la que el tutor estructuraba el contenido del dominio en el aula. El profesor recibe el

“feedback” de los alumnos e intenta inferir el estado cognitivo actual del alumno y a
partir de esto el modifica su comportamiento (a través de estrategias de enseñanza) para
que el alumno obtenga el mayor beneficio.
El Scholar es el primer programa para la enseñanza que utiliza una representación del
conocimiento basada en Inteligencia Artificial (IA) [Castillo et al., 1998]. Su principal
objetivo es enseñar la geografía de América del Sur a estudiantes de nivel primario. Es
el primer sistema en reconocer la posibilidad de separar el conocimiento de la materia a
estudiar del resto de la aplicación. Consta de una interface de línea de comandos
tradicional, donde Scholar plantea preguntas sobre el tema y el alumno las contesta. Se
evalúa la respuesta y se genera una retroalimentación. Cuenta también con un reloj para
indicarle al estudiante que está tardando demasiado [Carbonell, 1970].
Este enfoque pretende buscar una instrucción más personalizada, al contrario de los
CAI´s, en la que estos sistemas no realizan la tarea de enseñar en una única forma. El
sistema propuesto por Carbonell utilizaba redes semánticas15 para mantener un dialogo
con el alumno en formato textual utilizando un subconjunto de palabras del lenguaje
natural. Luego aparecieron trabajos como Why o Sophie de Collins y Brown [Stevens et
al., 1977].
Hasta ese entonces los términos CAI (o Intelligent CAI) y los Sistemas Tutores
Inteligentes (STI) eran considerados sinónimos [Villareal Goulart et al., 2001],
actualmente estos tipos se encuentran el área de IA-Education [Giraffa et al., 1999].
A través del análisis de la aplicación Scholar, Collins [Stevens et al., 1977] presentó el
proyecto Why, donde utilizó el método socrático de enseñanza siguiendo los
lineamientos propuestos por Carbonell [Carbonell, 1970]. En este caso el tutor socrático
enseñaba a través de la exposición indirecta, mediante las cuestiones sucesivas que se
requieren para formular los principios principales para poder analizar y evaluar las
hipótesis, descubrir las contradicciones y finalmente realizar las inferencias correctas.
En la década de los ochenta, el creciente interés en los modelos didácticos

computacionales diversificados, amplió el campo en el conocimiento y entendimiento
del tutor humano, cuya complejidad no había sido tratada computacionalmente. El tutor
Quadratic [O'Shea, 1981] podía modificar sus propias estrategias, aunque era solamente
una modificación de parámetros en lugar de un cambio efectivo de estrategias.
Luego, se desarrolló el sistema Predicate Logic Advisory Tool denominado Plato que
enseñaba matemáticas a los niños de nivel primario. Plato generaba problemas y
presentaba “apuntes” al alumno. Uno de sus módulos estaba constituido por el juego
“How the West was won”, que consistía en usar operaciones matemáticas, para avanzar;
el juego incluye a West, el asesor inteligente que apoya al estudiante aprendizaje los
conceptos matemáticos asociados al juego. Se lo puede ver como el primer entorno de
aprendizaje completo [Castillo et al., 1998]. El paradigma utilizado es “Issues and
Examples” (temas pendientes y ejemplos). En él, se enumeraron todos los tipos de
combinaciones de operadores, a los que se llaman “temas pendientes”, es decir, lo que
15
Una red semántica es una estructura para la representación de conocimiento definida como un conjunto
de nodos interconectados por arcos rotulados. Las redes de este tipo sólo captan las definiciones de los
conceptos, también y de manera inherente proporcionan uniones entre otros conceptos [Chaiben, 1996].

al alumno le resta por aprender (esta es la información que debe ser utilizada en el
módulo tutor). Luego, se esperaba el momento oportuno para mostrarle los ejemplos de
cómo aplicar el tema pendiente y el beneficio que esto representa. Este paradigma es
aplicable, y se pueden construir STI en forma general estableciendo los conceptos a
enseñar (los “temas pendientes”); y reconocedores de patrones para saber si el
estudiante los domina o no [Castillo et al., 1998].
En la década de los noventa las contribuciones en áreas, como las redes de

computadoras y los sistemas distribuidos y de comunicación proporcionaron nuevas
herramientas que se podían aplicar a los STI, como por ejemplo: e-mail, los foros,
Internet en general, con información On-Line; además de los recursos didácticos
importantes, como videos, imágenes, videoconferencias, etc. [Boff et al., 2000;
Fernández et al., 2000; Zeve et al., 2000]. Estas nuevas herramientas permitieron
revalorizar el aprendizaje guiado por computadora. A principios del dos mil Konzen
[Konzen, 1995] dio el primer paso para determinar el perfil del alumno, esto
influenciará la exposición del contenido a través de un cuestionario que se presenta al
alumno. También Kawasaki propone un modelo siguiendo distintos principios
pedagógicos [Kawasaki, 2000] y en la actualidad existen implementaciones del módulo
del estudiante usando de redes Bayesianas para el modelado.
STI Autor Año Dominio Características

Scholar Carbonell 1970 Geografía Lenguaje natural
Why Stevens, Collins 1977 Meteorología Dialogo socrático
Sophie Brown, Burton 1977 Electrónica Interface NLP
Wusor Goldstein 1979 Estrategia Estructura superpuesta
Guidon Clancey 1981 Tutor Mycin Primer “glass-box”
West Burton 1981 Estrategia Entrenamiento y ejemplos
Buggy Brown 1981 Aritmética Conocimiento incorrecto
Debuggy Burton, VanLehn 1982 Aritmética Diagnostico off-line
Steamer Stevens, Hollan 1983 Diseño de calderas Simulación, modelo mental
LMS Sleeman 1984 Algebra Reglas MAL
Meno Wolf 1984 Programación Gerenciamiento de discurso
Proust Jhonson 1984 Programación Diagnostico de intenciones
ACTP Anderson 1984 Tutor de Lisp Modelado cognitivo
Sierra VanLehn 1987 Aritmética Predicción de errores
Sherlock Lesgold, Katz 1991 Electrónica Aprendizaje cognitivo
CircSim Evens, Michael, Rovick 1996 Medicina Realmente utilizado
Tabla 2.5: Características de los STI entre los 70’ y 90’ [Kinshuk, 1996]
La Tabla 2.5 resume las principales características de los primeros Sistemas Tutores
Inteligentes que aparecieron, desde principios de la década del setenta hasta mediados
de la década de los noventa.
2.3.6.2 – Técnicas Educativas Generales
La idea de utilizar la tecnología y particularmente la computación en el campo de la

enseñanza tanto en las escuelas como en universidades no es nueva. La Instrucción
Asistida por Computadora (CAI) hoy se ha integrado, alentada por el abaratamiento de
los costos de hardware y el acceso a Internet. [Nakabayashi, 1997; Alpert et al., 1999;
Yang et al., 2002].

Durante el proceso de aprendizaje, se quiere promover la interacción entre el estudiante

y el docente (en este caso personificado por el Sistema Tutor Inteligente) por lo que
sería adecuado un sistema que permita “múltiples estrategias”. Esto le brindaría
robustez y el nivel de adaptación a las características cambiantes de los estudiantes.
Castillo [Castillo et al., 1998] establece que la pedagogía influye en el desarrollo de

sistemas de enseñanza, los que deben basarse en el modelo del estudiante, así como las
estrategias para enseñar efectivamente, en teorías de instrucción, por lo tanto abarca
tanto al modelo del estudiante y al modelo del tutor (estrategias de enseñanza). Castillo
[Castillo et al., 1998] sostiene que: “La psicología interviene en el establecimiento de
modelos cognitivos, necesarios para el entendimiento y aplicación apropiadas de los
modelos de enseñanza citados” a fin de dar cuenta que para enseñar se debe conocer
como los sujetos conocen.
La necesidad de que la instrucción asistida por computadora se transforme en un apoyo

efectivo para el tutelado, requiere de una base teórica que respalde el desarrollo de los
sistemas para que estos sean efectivos en el proceso de enseñanza.
2.3.6.3 – Teorías de Aprendizaje
Existen diferentes teorías que explican el proceso del aprendizaje, que se pueden
agrupar en:
· Instruccional: Es donde el profesor o tutor es el centro y el encargado de

diseñar el contenido, relegando al alumno a la función de “aprender” el
conocimiento que el profesor le comunica. Este proceso de aprendizaje es
altamente guiado por el profesor y no requiere la iniciativa personal del alumno.
· Aprendizaje por descubrimiento: Es donde el profesor tiene una tarea de

“explorador”, entregándole al alumno las herramientas necesarias para que este
descubra el conocimiento a su propio ritmo. Este proceso de aprendizaje no es
guiado y requiere de iniciativa por parte del alumno, ya que es este el encargado
de “descubrir” el conocimiento por sus propios medios, guiado por el tutor para
que se puedan lograr los objetivos de la sesión pedagógica planteados, pero
dando lugar a nuevos objetivos que surgen de la experimentación del alumno.
Los procesos de aprendizaje fueron tema de estudio desde siempre. Las primeras
reflexiones las expone Platón cuando en su libro La República [Platón, 2001], explica el
mito de las cavernas y aclarando que: “el mundo que se conoce es la proyección de
nuestras ideas innatas”. A esto se lo conoce como pensamiento racionalista. Luego,
Aristóteles, rechaza la teoría de las ideas innatas y establece que el conocimiento
procede de los sentidos que dotan a la mente de imágenes que se asocian entre si según
tres leyes: contigüidad, similitud y contraste, iniciando así el pensamiento
empirista. Estas teorías son reflotadas nuevamente, posteriormente, por Santo Tomás de
Aquino.

Las primeras aplicaciones de la CAI se dieron desde la visión conductista. Skinner año
muy influenciado por las investigaciones de Pavlov16 define al conductismo no como
una forma de estudiar la conducta sino como una filosofía de la ciencia dedicada al
objeto y a los métodos de la psicología. Skinner plantea que la conducta de los
organismos puede ser explicada a través de las contingencias ambientales, y los
procesos internos de naturaleza mental no tienen ningún poder causal-explicativo
[Hernández Rojas 1998]. En la actualidad el conductivismo ha evolucionado a modelos
cognitivistas más flexibles y adecuados que ponen en primer plano al estudiante en el
proceso educativo. A continuación se resumen los modelos más representativos y se
resaltan sus características principales.
A) Teoría de la Instrucción de Gagné
En esta teoría, el aprendizaje se define como un proceso que permite a un organismo

vivo modificar sus comportamientos en forma rápida y permanente; por tanto, el
aprendizaje se verifica cuando existe un cambio de comportamiento, relativamente
estable. Esto supone cuatro elementos: un aprendiz, una situación o entorno que permite
el aprendizaje, un comportamiento explícito del aprendiz y un cambio interno.
Esta teoría establece que hay varios tipos de aprendizajes y que por lo tanto son
necesarios diferentes modos de instrucción. Estos tipos son: información verbal,
destrezas intelectuales: discriminar, formar conceptos, aprender reglas, estrategias
cognitivas, actitudes y destrezas motoras.
Para cada tipo de aprendizaje son necesarias diferentes condiciones internas y externas.
Una vez que plantea estos factores que afectan al aprendizaje, Gagné puede plantear al
proceso de aprendizaje como un sistema, donde dichas entradas afectan la salida; y por
lo tanto, el profesor puede mejorar la salida controlando las entradas. Gagné sugiere
agregar el concepto de jerarquía como base para su descripción del funcionamiento del
sistema.
B) Teoría de Equilibración de Piaget
Para Piaget [Piaget, 1989] existen dos tipos de aprendizaje, uno el aprendizaje en
sentido estricto, a través del cual se consigue información específica y otro, el
aprendizaje en sentido amplio, que consiste en el progreso de las estructuras de
cognitivas. El aprendizaje se produce cuando se presentara un desequilibrio o conflicto
cognitivo que da lugar a dos procesos: la asimilación y la acomodación.
16
Pavlov, médico ruso, le presentó la comida a los perros de su laboratorio y la introducía con el sonido
de una campana, por medio de mediciones, luego un tiempo comprobó que el sonido de la campana
provocaba salivación en los caninos, aunque el sonido no viniese acompañado de comida. Luego de años
evaluando los resultados experimentales, estos darían lugar a la teoría conocida Condicionamiento
Clásico de Pavlov, que aportaría, mas adelante, las bases para el Conductismo, escuela psicológica que
pretende explicar y predecir la conducta y que aporta luz sobre muchos de los aprendizajes no sólo en los
perros, también en los humanos.

La asimilación es la integración de elementos exteriores a estructuras en evolución o ya

acabadas en el organismo [Piaget, 1989]. El individuo interpreta la información del
medio de acuerdo a sus conceptos disponibles. A través del proceso de acomodación, el
sujeto adapta sus conocimientos a la realidad en tanto y en cuanto contrasta con ella lo
asimilado; por otra parte se produce el cambio de estructuras cognitivas del individuo en
dos sentidos, el primero como consecuencia de la suma de nuevos conceptos y el
segundo como consecuencia de una reinterpretación de lo ya sabido a la luz de los
nuevos conocimientos.
La teoría de Piaget reduce todo el aprendizaje a adquisiciones espontáneas y necesarias.

Esto es un fallo puesto que la mayor parte de los conceptos en realidad no son
necesarios y además, no pueden adquirirse sin la intervención de la cultura y la
instrucción, es decir no son espontáneos.
C) Teoría sociocultural de Vigotsky
Vigotsky [Vigotsky, 1926] plantea que “estudiar las conducta del hombre sin lo
psíquico, como pretende la psicología, es tan imposible como estudiar lo psíquico sin la
conducta. Por tanto no hay lugar para ciencias distintas. El estado actual de las dos
ramas del saber plantea insistentemente la cuestión de tal necesidad y fecundidad de la
completa fusión de ambas ciencias”.
El aprendizaje sucede a partir de la interacción social, puede establecerse que: el

individuo reconstruye su saber debido a que se entremezclan procesos de construcción
personal y procesos en colaboración con los otros que intervinieron. En este el maestro
debe ser un agente facilitador y mediador de la cultura. En la Tabla 2.6 se puede ver el
paralelismo entre la concepción de Piaget y la de Vigotsky
Teoría de Piaget Teoría de Vigotsky

El conocimiento es un proceso de interacción El conocimiento es un proceso de interacción
entre el sujeto y el medio entendido físico entre el sujeto y el medio entendido social y
únicamente culturalmente
El ser humano al nacer es un individuo El ser humano al nacer es un individuo social
biológico
En el desarrollo del ser humano hay un proceso En el desarrollo del ser humano hay un proceso
de socialización de diferenciación social
La potencialidad cognoscitiva del sujeto La potencialidad cognitiva del sujeto depende de
depende de la etapa del desarrollo en la que se la calidad de la interacción social y de la ZDP del
encuentre. sujeto
El ser humano al nacer se encuentra en un El ser humano al nacer tiene una percepción
estado de desorganización que deberá ir organizada puesto que está dotado para dirigirla a
organizando a lo largo de las etapas del estímulos humanos y para establecer
desarrollo de su vida interacciones sociales
Tabla 2.6: Paralelismo entre la concepción de Piaget y la de Vigotsky
D) Teoría del Andamiaje de Bruner
Esta teoría está relacionada con la de Piaget, ya que enfatiza el aprendizaje por
descubrimiento. El alumno descubre, pues esto le causa mayor satisfacción y obtiene
una mayor retención. Llega un paso más adelante la teoría de Piaget, desarrollando un
proceso de instrucción donde el profesor debe crear un ambiente que favorezca lograr el

descubrimiento [Bruner, 1990]. Propone que los contenidos a enseñar se presenten

como un conjunto de problemas y relaciones que el alumno debe resolver a fin de que se
interese y resulte significativo el aprendizaje [Guardia Robles, 1993].
Bruner [Bruner, 1990] explica cómo el estudiante llega a dominar los contenidos que el
docente le propone construyendo el concepto de andamiaje, estrechamente ligado al de
zona de desarrollo próximo de Vigotsky. Según esta idea, en el proceso interacción y
diálogo en que se basa la enseñanza, el experto tiende un conjunto de andamios o
ayudas por medio de las cuales el alumno elabora las construcciones necesarias para
aprender los contenidos. El andamiaje debe contemplar los rasgos particulares del
alumno. Y se irán regulando en la medida en que vayan progresando en sus habilidades.
Así, algunos requerirán apoyos como explicaciones, modelos, etc., mientras que otros
necesitarán apoyos más complejos.
Progresivamente, el maestro ajustará el sistema de ayudas y apoyos necesarios

conforme se desarrollen las habilidades de los alumnos, y así poder ir cediendo el
control y el manejo de los contenidos y formas de discurso a aprender.
E) Teoría del Aprendizaje Significativo de Ausubel [Ausubel et al., 1983]
Trata de la adquisición de aprendizaje significativo, por lo tanto no considera el

aprendizaje mecánico (de memoria). Para considerar que un aprendizaje es significativo,
requiere tener un sentido para ser incorporado al conjunto de conocimientos que el
sujeto posee (el concepto aprendido debe relacionarse con conceptos previamente
adquiridos). También considera al aprendizaje como receptivo, ya que es el profesor
quien establece los contenidos para facilitar la organización del nuevo contenido en la
estructura mental del alumno.
Ausubel establece que para que se produzca la reestructuración es necesario una

instrucción que presente la información organizada y explícita que desequilibre las
estructuras existentes. Un aprendizaje es significativo si puede incorporarse a las
estructuras de conocimiento, es decir los nuevos conceptos adquieren significado para
el sujeto dentro de sus estructuras cognitivas. Un aprendizaje es memorístico cuando
los conceptos aprendidos no están relacionados entre sí y carecen de significado para la
estructura del sujeto. En general un aprendizaje significativo es más eficaz que el
memorístico puesto que: produce retención más duradera, facilita nuevos aprendizajes y
produce cambios que persisten más allá del olvido de los detalles concretos. Otro aporte
de Ausubel es el concepto de los organizadores previos, sobre los cuales el alumno se
apoya, de tal forma que éstos hacen las veces de estructura o andamio entre los
conocimientos a adquirir y los que ya poseía.
F) Inteligencias Múltiples de Howard Gardner.
Esta teoría de la inteligencia humana, desarrollada por el psicólogo Howard Gardner

[Gardner, 1993], establece que hay al menos ocho formas en las que las personas
perciben y entienden el mundo. Gardner llama a cada una de estas formas inteligencias
(conjunto de habilidades que permiten resolver problemas de la realidad).

Gardner [Gardner, 2003] define una inteligencia como “La capacidad de resolver
problemas, o de crear productos, que sean valiosos en uno o más ambientes
culturales”. Este autor fundamenta su estructura en pruebas biológicas y antropológicas
y, más específicamente, en bases neurológicas, evolucionistas y transculturales. No
obstante, el autor aclara que es un acercamiento que no establece las fuentes de tales
capacidades o los medios para medir éstas. Gardner [Gardner, 1993] presenta una
clasificación de inteligencias, aunque sugiere que no es terminante:
· Verbal-lingüística. · Musical-Rítmica.
· Lógico-matemático. · Interpersonal.
· Visual-espacial. · Intrapersonal.
· Kinestésica. · Naturalista.
Para Gardner [Gardner, 1993]: “El objetivo de la escuela debe ser el de desarrollar las
inteligencias y ayudar a la gente a alcanzar los fines vocacionales y aficiones que se
adecuen a su particular espectro de inteligencias”. Este objetivo se consigue con una
escuela centrada en los individuos, donde la evaluación de las capacidades y las
tendencias individuales es continua.
2.3.6.3 – Técnicas Educativas Aplicables
Una vez presentadas las técnicas educativas mas importantes, se debe analizar cuales de
ellas son aplicables a la enseñanza de lenguajes de programación con paradigma lineal
estructurado y dentro de ellas, cuales son implementables en un asesor inteligente o un
sistema tutor inteligente.
Cualquiera de las teorías de enseñanza explicadas en los apartados anteriores resulta útil
para entender el proceso de aprendizaje de lenguajes de programación. La selección de
un marco teórico adecuado solo puede justificarse por medio de razones pedagógicas,
correspondientes al tipo de alumnos con el que se va a enfrentar al sistema y a las
técnicas de programación o características disponibles para el futuro sistema [Perkins,
1995]. A continuación se estudiará la aplicabilidad de cada uno de los modelos
anteriormente detallados a un Sistema Tutor Inteligente (STI) aplicado a la enseñanza
de la programación.
Como no es el propósito de esta tesis evaluar los distintos modelos de enseñanza y de

aprendizaje, por loo que se seleccionó la Teoría Uno [Perkins, 1995] que no es un
modelo, ni un método de enseñanza, sino un conjunto de recomendaciones compatibles
con cualquier teoría. Básicamente, ella estipula que: “La gente aprende más cuando
tiene una oportunidad razonable y una motivación para hacerlo” y para aplicarla se
deben reunir las siguientes condiciones [Perkins, 1995]:
· Información clara a través de descripción, ejemplos de los objetivos,

conocimientos requeridos y de los resultados esperados.
· Práctica reflexiva, es decir, oportunidad para el alumno de ocuparse activa y

reflexivamente de aquello que deba aprender.

· Realimentación informativa a través de consejos claros y precisos para que el

alumno mejore el rendimiento y pueda proceder de manera más eficaz.
· Fuerte motivación intrínseca y extrínseca mediante actividades ampliamente

recompensadas, sea porque son muy interesantes y atractivas en sí mismas o
porque permiten obtener otros logros que importan al alumno.
Por lo tanto se tomará la Teoría Uno planteada por Perkins [Perkins, 1995] como la
base teórica del Sistema Tutor Inteligente (STI), de la que se toman las bases de las
distintas formas de enseñanza disponibles. Perkins [Perkins, 1995] plantea que si se
combinan las condiciones que estipula la Teoría Uno con cada uno de los programas de
estudio, se obtienen los métodos respectivos. En otras palabras, la Teoría Uno se
“personifica” de distintas maneras según el programa del momento. Las cuatro formas
principales se enumeran a continuación y se explican más detalladamente en las
secciones siguientes:
· La instrucción didáctica (o magistral).

· El entrenamiento.
· La enseñanza socrática.
· Otras.
A) La Instrucción Didáctica.
Según Perkins [Perkins, 1995] es la presentación clara y correcta de la información por

parte de los maestros y de los textos. Su objetivo se centra especialmente en la
explicación donde se exponen “los qué” y “los por qué” de un determinado tema.
Es fundamental que se aclaren los componentes básicos de una buena explicación, ya

que en la instrucción didáctica el alumno queda relegado a un papel de sujeto pasivo y
el tutor o maestro queda en primer plano de proveedor único de los saberes y
conocimientos. Algunas de las características que debe reunir una buena explicación en
la práctica educativa pueden enumerarse a continuación:
· Identificación de objetivos para los alumnos: Este paso quizás es uno de los
más importantes ya que establece cuál es el objetivo de la sesión pedagógica que
se está llevando a cabo y qué es lo que se pretende obtener como resultado para
los estudiantes una vez finalizada dicha sesión.
· Supervisar y señalar el avance hacia los objetivos: Se debe verificar a través

de preguntas clave para la lección que los conocimientos que se han explicado
han sido correctamente interpretados por el estudiante y que este puede seguir
adelante hacia los objetivos de la lección sin correr el riesgo de que
concepciones erróneas puedan llegar a modificar la interpretación por parte del
alumno de conocimientos posteriores.
· Mostrar numerosos ejemplos sobre los conceptos analizados: Los ejemplos

son la herramienta pedagógica más útil a la hora de verificar si los estudiantes
realmente entendieron el concepto explicado, así como también para incorporar

a la estructura cognitiva dicho concepto, yendo desde una abstracción mayor,

como lo es el concepto, hasta instancias particulares de dicho concepto.
· Legitimar un nuevo concepto o procedimiento mediante principios ya

conocidos por los alumnos: Un elemento pedagógico realmente útil es la
relación entre conceptos conocidos por el estudiante con el concepto que se está
intentando explicar. Perkins [Perkins, 1995] da un ejemplo típico de tal cosa
para ilustrar esta característica de la instrucción didáctica:
Maestro: “¿El concepto de nicho es realmente útil para hablar de los

sistemas ecológicos? Bien, examinemos esta cuestión. Pensemos en otras
situaciones en las que hablamos de funciones dentro de un sistema; por
ejemplo, las funciones de las personas en una empresa o en la escuela.”
Las clases del tipo prácticas no quedan fuera de este modelo, sino que en ellas se alienta
a incluir exposiciones complementarias, para señalar vínculos entre los conceptos
familiares y los nuevos conceptos, aclarando las condiciones de aplicabilidad y de no
aplicabilidad de los mismos. La interacción siempre está liderada por el maestro o el
tutor relegando al estudiante a un segundo plano donde su único rol es el de asimilar la
información que se le está presentando, por lo tanto los elementos básicos de la
instrucción didáctica tienen que ver sobre todo con la claridad informativa.
B) El Entrenamiento.
Existe un vínculo entre el entrenamiento y la instrucción didáctica y por eso se lo

presenta en segundo lugar. Sin una instrucción didáctica que presente cierta base de
información clara sobre los conceptos nuevos, los estudiantes carecerían de los
conocimientos básicos para realizar las ejercitaciones prácticas. Surge entonces una
aparente contradicción, que es, dada la claridad informativa de la instrucción didáctica,
cuál pasa a ser la función del maestro, si en una forma ideal, la instrucción didáctica
aclaró todas las dudas posibles sobre el concepto explicado.
El entrenamiento ofrece una respuesta, ya que hace hincapié en dos de las condiciones
planteadas por la Teoría Uno: la práctica reflexiva y la realimentación informativa. Las
principales actividades del docente entrenador consisten:
· Asignar prácticas.
· Alentar a los alumnos a reflexionar sobre lo que están haciendo.
· Ofrecer la realimentación.
Al mismo tiempo, se espera que el docente entrenador suministre la información en

forma clara mientras que es la relación entre el entrenador y sus alumnos la que debe
fomentar mecanismos de motivación de estos últimos y garantizar así una de las
cuestiones fundamentales planteadas por la Teoría Uno que afirma que “La gente
aprende más cuando tiene una oportunidad razonable y una motivación para hacerlo”.
Perkins [Perkins, 1995] plantea una analogía muy clara con respecto al fútbol: “El
entrenador observa desde afuera el desempeño de los deportistas y les da consejos.
Elogia los puntos fuertes, detecta los débiles, hace observar ciertos principios, ofrece

guía e inspiración y decide qué tipo de prácticas se deben enfatizar”. Y es esta función
tan importante la que se extrapola y se aplica en cualquier dominio, sea este fútbol,
clase de matemática o literatura.
C) La Enseñanza Socrática.
Ambos métodos vistos con anterioridad (la instrucción didáctica y el entrenamiento)

poseen un aspecto regulativo, pues su función consiste en moldear y guiar las
actividades de los alumnos y como se explicó anteriormente se relega al estudiante a un
papel secundario, teniendo como única función la de asimilar los conocimientos que se
le presentan por el maestro tutor o el maestro entrenador.
En este marco surge el método socrático, a través del cual se logra que los estudiantes
trabajen de una manera más flexible, pero no en forma libre, sino que continuamente
estén recibiendo el apoyo en sus investigaciones por parte de un maestro o tutor, pero
sin el esquema más rígido en el que el tutor les dice todo el tiempo lo que tienen que
hacer. Perkins [Perkins, 1995] plantea que de esta forma el estudiante debe aprender no
solo las respuestas sino que también el “arte de las preguntas”.
La enseñanza se realiza cuando el maestro socrático plantea un enigma conceptual e

incita a investigar el asunto de manera libre por parte de los estudiantes, haciendo
preguntas del tipo:
· ¿Qué piensan al respecto?

· ¿Qué posición se podría tomar?
· ¿Qué definiciones necesitamos?
Luego de la investigación inicial se proponen ideas, criterios y definiciones, donde el

maestro actúa como incitador y moderador en la conversación: presta ayuda cuando las
paradojas estancan el proceso de aprendizaje y genera contraejemplos y potenciales
contradicciones cuando percibe en los estudiantes una satisfacción prematura. De esta
manera el aprendizaje es “guiado” por los tutores hasta alcanzar el objetivo, ya que sin
una guía eficaz los estudiantes pueden perderse por las ramas, pero esto no se hace de
una manera rígida como en la instrucción didáctica y el entrenamiento, ya que el
método socrático espera que sea el mismo estudiante el que realice los descubrimientos
por si mismo. El científico cognitivo Collins [Perkins, 1995] analizó los pasos
fundamentales del método socrático que se describen a continuación:
· Se seleccionan ejemplos positivos y negativos para ilustrar las cualidades

pertinentes al tema en consideración.
· Se varían los casos sistemáticamente a fin de centrar la atención en datos
específicos.
· Se emplean contraejemplos para poner en tela de juicio las conclusiones del
alumno.
· Se proponen casos hipotéticos para que el alumno reflexione sobre situaciones
afines que podrían no ocurrir naturalmente.

· Se utilizan estrategias de identificación de hipótesis a fin de forzar la

articulación de una hipótesis específica de trabajo.
· Se emplean estrategias de evaluación de hipótesis para fomentar la evaluación
crítica de predicciones e hipótesis.
· Se promueve la identificación de otras predicciones que podrían explicar el
fenómeno en cuestión.
· Se utilizan estrategias capciosas para inducir al alumno a hacer predicciones
incorrectas y formulaciones prematuras.
· Se procura que el alumno deduzca las consecuencias hasta llegar a una
contradicción para que aprenda a construir teorías válidas y consistentes.
· Se cuestionan las respuestas provenientes de autoridades tales como el maestro y
el manual a fin de promover el pensamiento independiente.
Uno de los conceptos claves de la Teoría Uno, es que el maestro socrático no provea
abundancia de datos, pero controle la claridad y la calidad de la información
suministrada por los alumnos haciéndoles preguntas. Cuando los alumnos discuten
entre sí sobre una determinada cuestión, el maestro socrático les exige una práctica
continua de reflexión. Provee además, realimentación inmediata por medio de estímulos
y críticas, e incita a que todos los participantes de la conversación hagan lo mismo.
D) Otros Métodos de Enseñanza.
Los protocolos pedagógicos propuestos por la Teoría Uno no son los únicos
acercamientos que proveen las características requeridas por la Teoría Uno:
“información clara, práctica reflexiva, realimentación informativa y fuerte motivación
intrínseca y extrínseca”. Existen otras aproximaciones como pueda serlo el aprendizaje
cooperativo y la colaboración entre pares, que vale la pena resaltar en el marco de los
asesores inteligentes, donde el sistema debe reaccionar como un “estudiante virtual”
que interactúa con los estudiantes usuarios del sistema para resolver los distintos
problemas que se le presentan y para lograr definiciones básicas para los conceptos que
se pretenden enseñar en una sesión pedagógica a través del “andamiaje” [Ausubel et al.,
1983; Guardia Robles, 1993] como lo hará un ayudante alumno.
Perkins [Perkins, 1995] sostiene que los niños aprenden mucho mejor en grupos
cooperativos bien configurados que en soledad. Por lo general, las agrupaciones
cooperativas pueden ayudar a lograr determinados fines, sin la planificación cuidadosa
que requieren los métodos como la instrucción didáctica y el entrenamiento. Los
resultados obtenidos son satisfactorios por que el aprendizaje cooperativo exige que
todos los participantes se hagan responsables del desempeño del grupo.
El aprendizaje cooperativo y la colaboración entre pares pueden utilizar la dinámica de

grupos para promover el aprendizaje reflexivo, donde los estudiantes piensan y discuten
los conceptos que se les intenta enseñar y los problemas que se deben resolver. En el
aprendizaje cooperativo y colaborativo la predisposición hacia la resolución de la tarea
brinda la motivación del contacto social para mantener a los estudiantes interesados en
sus actividades académicas.

Entonces parecería que en el caso del aprendizaje cooperativo y colaborativo el docente

no posee un rol que deba cumplir y por lo tanto este método de enseñanza no seria
aplicable en los Sistemas Tutores Inteligentes, pero un análisis mas profundo revela que
los docentes tienen las siguientes tareas [Perkins, 1995]:
· El maestro “entrena” a los alumnos para que juzguen con criterios propios
adecuados a la circunstancia planteada.
· El maestro debe “aumentar” el interés intrínseco de los problemas que el mismo
presenta.
· El maestro puede “pedir a los alumnos que se califiquen mutuamente”, pero
ofreciendo una fuerte realimentación con respecto a qué tipo de respuestas
tienen más o menos sentido y por qué.
Esta teoría sobre la motivación intrínseca supera a la Teoría Uno por una razón muy
sencilla: la Teoría Uno no dice nada sobre las interacciones entre la motivación
intrínseca y la motivación extrínseca; sin embargo, hay muchas interacciones
importantes por las que hay que preocuparse cuando se quiere brindar una fuerte
motivación intrínseca.
También podrían tenerse en cuenta la valoración de las inteligencias múltiples,

desarrolladas por el psicólogo Howard Gardner [Gardner, 1993], alegando que las
concepciones convencionales de la inteligencia humana basadas en el coeficiente
intelectual son demasiado monolíticas. Según Gardner, la inteligencia humana posee
siete dimensiones diferentes o siete inteligencias y a cada una de ellas le corresponde un
determinado sistema simbólico (ver sección 2.3.6.3 – Teorías de Aprendizaje). Por lo
tanto se podría desarrollar un protocolo pedagógico especifico para cada una de estas
inteligencias múltiples, donde, por ejemplo para un individuo con una inteligencia del
tipo lógico-matemática, los problemas se le presenten en forma de notación formal
matemática, mientras que para el resto de las inteligencias se les presente en lenguaje
natural, para maximizar la comprensión del problema en cada uno de los casos.
Gardner [Gardner, 1993] señala que la práctica educativa convencional se centra

fundamentalmente en la inteligencia lingüística y matemática, pero dado el carácter
múltiple de la inteligencia humana se debería dar cabida a las diversas habilidades de las
personas. Esto puede incluirse en el Sistema Tutor Inteligente (STI) a través de distintos
protocolos pedagógicos que se adecuen de la mejor manera a cada uno de los
estudiantes.
2.3.7 – Modelos de Implementación de Sistemas Tutores Inteligentes (STI)
Las técnicas convencionales de programación para desarrollar Sistemas Tutores

Inteligentes (STI), se basan en el planteo de los módulos básicos, que interactúan entre
sí y donde cada uno de ellos posee la información necesaria para poder cumplir con su
tarea. Esta definición de módulos dentro de un sistema tutor inteligente es útil a la hora
de identificar cada una de las partes de éste, pero es casi imposible, hasta el momento,
que en las implementaciones de los Sistemas Tutores Inteligentes estos módulos estén
definidos completamente como lo indica la teoría que los soporta, ya que siempre existe
un solapamiento con el dominio del problema a resolver con todos los demás módulos.

La mayoría de los Sistemas Tutores Inteligentes (STI) no presenta el nivel esperado de

“inteligencia” [Bolan Frigo et al., 2004]. Independientemente de las técnicas de
programación utilizadas, la dificultad de modelar como funciona la mente humana
impide que muchos de los Sistemas Tutores Inteligentes alcancen sus objetivos. Si bien
existen versiones que aseguran que el modelado de Sistemas Tutores Inteligentes (STI)
con el paradigma de programación multiagentes es el mejor camino para construir el
modelo pedagógico, como la de Bolan Frigo, Pozzebon y Bittencour [Bolan Frigo et al.,
2004], no existen pruebas sólidas de que esto sea así, ya que existen problemas de
comunicación entre los agentes que dificultan su cooperación.
Además, tanto el paradigma de agentes como el orientado a objetos comparten el pasaje

de mensajes para realizar la comunicación y el empleo de la herencia y la agregación
para definir su estructura. Ahora, las principales diferencias entre estos paradigmas
estriban en que los mensajes de los agentes tienen un tipo predeterminado, en el uso de
actos comunicativos y en que el estado mental del agente se basa en sus creencias,
intenciones, acuerdos, deseos y demás motivaciones (módulo BDI) [Iglesias et al.,
2001].
Una de las ventajas principales, según Iglesias, Garijo y Gonzalez [Iglesias et al., 2001]
es la popularidad de las metodologías orientadas a objetos, para las que existen muchas
metodologías para implementar este paradigma, como es el caso de OMT (Object
Modeling Technique), OOSE (Object Oriented Software Engineering), OOD (Object
Oriented Design), RDD (Responsibility Driving Design) y UML (Unified Modeling
Language) entre otras. La experiencia adquirida con la utilización de estas metodologías
desde hace por lo menos una década puede dificultar la adopción de las metodologías de
agentes por la “inercia” que se genera en la industria, hasta tanto se disponga de una
propia.
Por lo tanto, independientemente del paradigma de programación que se utilice para la

implementación de los Sistemas Tutores Inteligentes, siempre se deberán respetar las
estructuras de los módulos, las interfaces y los distintos submódulos que componen las
estructura compuesta por Carbonell [Carbonell, 1970] o alguna de sus modificaciones
posteriores [Salgueiro et al., 2004; Costa et al., 2004].
2.4 – Trabajos Similares
Comenzando con las primeras implementaciones de los sistemas que seguían el modelo
de instrucción asistida por computadora (CAI), en la década de los setenta, aparecen
implementaciones como el sistema Scholar que lleva a la práctica la nueva propuesta de
Carbonell [Carbonell, 1970]. Esta es la primera implementación práctica donde el
sistema recibe un feedback de los alumnos e intenta inferir el estado cognitivo de los
mismos.
Luego, con el advenimiento de la IA y la idea de que el sistema no realice la tarea de

enseñar de una única forma, aparecieron los tutores Why y Sophie de Collins y Brown
[Stevens et al., 1977]; también muy limitados en su funcionalidad, pero ellos
diferenciaron los Intelligent CAI de los STI que hasta esa época se los consideraba
sinónimos [Villareal Goulart et al., 2001].

El proyecto Why de Collins [Stevens et al., 1977] seguía los lineamientos propuestos
por Carbonell, pero, explicando de modo socrático y por exposición indirecta. Todas las
aproximaciones a resolver el problema en la década del 70 eran muy rudimentarias y se
encuentran en desuso.
La década del 80 trajo modelos más diversificados. El tutor Quadratic podía modificar
sus estrategias pedagógicas, aunque de un modo bastante limitado, luego aparecieron
contribuciones informáticas (Internet, Videos, sonidos, etc.) a los STI a fines de los 80
lo cual aumentó la cantidad de elementos didácticos disponibles con los que el tutor
podía trabajar. Hasta ese momento toda la interface era en modo texto.
2.4.1 – El Proyecto CircSim
Actualmente hay que destacar el proyecto CircSim, Sistema Tutor Inteligente (STI)
creado en conjunto por el Departamento de Ciencias de la Computación del Illinois
Institute of Technology y el Departamento de Fisiología del Rush College of Medicine.
Este tutor es el más avanzado actualmente y su implementación se utiliza en el Rush
College of Medicine para complementar las clases teóricas sobre problemas
cardiovasculares [Kim, 1989; Kim, 2000; Cho, 2000; Hume, 1995; Shah, 1997; Hume
et al., 1992].
La base es la construcción de un sistema tutor inteligente basado en el lenguaje natural

para los estudiantes de medicina del primer año que están aprendiendo el tema de
control de reflejos de la presión sanguínea. En el CircSim, los estudiantes resuelven
pequeños problemas mientras son tutelados en forma socrática por la computadora
[Woo Woo, 1991].
Dado que es el único gran tutor inteligente que realmente se está utilizando, esto hace
necesario estudiar sus características y motivaciones para evaluar los factores de su
éxito y analizar su puesta en operación para asistir a los estudiantes de medicina sin la
supervisión directa de un tutor humano.
La idea de este proyecto no es nueva, sino que viene de la década del 70, donde
MacMan propone un modelo matemático para el reflejo baroreceptor [Dickinson et al.,
1973], se generó una implementación para Fortran, con una interface simple donde solo
se podían modificar los parámetros de funcionamiento. Se realizaron luego distintas
codificaciones, pero no fueron muy utilizadas por que no resultaban útiles para la
enseñanza por varios factores [Kim, 1989; Kim, 2000; Cho, 2000; Hume, 1995; Shah,
1997; Hume et al., 1992; Woo Woo, 1991].
Como una mejora, nació el sistema Hearsim [Rovick et al., 1983] en 1983 el cual ya
contenía dos grandes componentes: el modelo matemático de MacMan y un segundo
componente llamado el módulo de enseñanza. Hearsim podía predecir el estado del
alumno en un momento dado y mostrar una tabla con las características más probables
del mismo. Si bien se realizaron muchas pruebas con este simulador, los estudiantes no
llegaron a utilizarlo.

En este entorno nace el CircSim programado en Basic para Microsoft D.O.S. ® [Rovick
et al., 1986] y su desarrollo se centra en que no todos los profesores de las escuelas
médicas pueden acceder a Plato [Walsh, 1987] y por lo tanto se les dificultaba el uso de
los programas anteriores.
A diferencia del Hearsim, el CircSim no solamente almacena las predicciones correctas

que realizaba, sino también la información necesaria para mostrar los resultados de cada
uno de los procedimientos. En CircSim no existe más el modelo matemático. Del lado
del estudiante, éstos adquieren hechos y conceptos acerca el reflejo baroreceptor por sus
lecturas, al asistir a las clases y por participar en otras sesiones de resolución de
problemas. El CircSim no explica los temas desde su base, sino que el alumno ya tiene
conocimientos del tema cuando utiliza el simulador. Desde entonces el programa se
utiliza regularmente en los laboratorios de computadoras, en sesiones donde algún
instructor humano se encuentra presente para interactuar con los estudiantes en caso de
problemas [Hume, 1995; Shah, 1997].
Este tutor se basa en un modelo cualitativo en el que intervienen siete parámetros

fisiológicos básicos. Los parámetros y sus relaciones causales forman un mapa de
conceptos [Evens et al., 2001]. Esto elimina el modelo del dominio, que al ser fijo en
este tutor no requiere modelado adicional. Los componentes básicos del tutor CircSim
son [Evens et al., 2001]:
· El Input Understander. · El procesador de discurso.

· El modelador del alumno. · El generador de textos.
· El planeador de la lección. · La base de conocimientos /
solucionador de problemas.
Para hacer una analogía con el modelo planteado en esta tesis se pueden agrupar estos
componentes de la siguiente manera:
· Interface: El Input Understander, Generador de textos.

· Módulo del alumno: Se representa por el modelador del alumno.
· Módulo del tutor: El planeador de la lección, el procesador de discurso y el
solucionador de problemas.
· Módulo de conocimientos: es la base de conocimientos
La analogía es incompleta ya que el CircSim no está pensado como un Sistema Tutor

Inteligente (STI) multipropósito, con todos los módulos completos, sino que desde el
momento en el que Rovick y Michael en 1986 plantean el CircSim para PC [Rovick et
al., 1986] (y antes también en el Hearsim [Rovick et al., 1983]) el asesor se basó en la
enseñanza del reflejo baroreceptor.
Su funcionamiento básico es el siguiente: se presenta un problema a un alumno, quien

lo resuelve (si puede) y la respuesta de éste se compara con la del solucionador de
problemas. Para continuar en el siguiente paso, el planificador de la lección toma las
predicciones del alumno y el modelo del alumno, para generar una conversación y
detectar los errores posibles del alumno [Evens et al., 2001]. Este ciclo continúa hasta
obtener el objetivo final del problema planteado. El ciclo está implementado sobre una
máquina de estados finitos y los planes están almacenados en una pila.

Además, posee unos 750 lemas así como también un léxico básico, complementado con
funciones léxicas y gramáticas que se utilizan para generar las frases. Como es
importante la corrección ortográfica de las frases para que el sistema pueda entenderlas,
existe un corrector que corrige automáticamente las palabras, que o bien son escritas
mal por los alumnos, o bien son mal abreviadas [Evens et al., 2001].
La corrección se basa en un algoritmo de tres vías, el cual abre una ventana para
preguntar las palabras que no se reconoció correctamente y las palabras candidatas a
suplantarlas. Para los errores más comunes, como elisiones (por ejemplo: del por de el,
al por a el), substituciones (por ejemplo: fusión por fusóin), etc. estos no se preguntan y
se toma el candidato más probable. [Evens et al., 2001]
El generador de texto produce oraciones de forma lógica por el planificador. Las

explicaciones pueden darse en varias maneras, por ejemplo en forma declarativa y en
forma interrogativa. Las formas lógicas se utilizan para llenar templates abstractos y se
los transforma por medio de la pasivación, la inserción de verbos auxiliares y otros
elementos gramáticos necesarios para crear oraciones con significado en el lenguaje
natural. El tutor esta construido para dar sus respuestas en el idioma inglés americano.
2.4.2 – Falencias del CircSim
Si bien el CircSim posee excelentes resultados en experiencias en aulas reales, carece de

una característica fundamental, que es su escalabilidad, solo funciona correctamente en
el dominio de la enseñanza del reflejo baroreceptor [Evens et al., 2001] ya que no ha
sido pensado para representar un asesor inteligente general multipropósito. Este
problema se reitera todos los tutores estudiados en esta tesis, y se debe sacrificar
versatilidad para mejorar el resultado del tutelado de un tema en particular.
Si bien esta solución de compromiso puede ser la única opción válida en el estado actual
de desarrollo de los STI, se podría modularizar en el marco teórico clásico de los STI lo
cual permitiría un cambio de dominio mucho más simple.
Otro problema del CircSim es que las variables que influyen en el reflejo baroreceptor
están relacionadas linealmente hacia un único objetivo, es decir, la respuesta final al
problema planteado por el CircSim es única. En la mayoría de los problemas en
ingeniería en general, y en los de programación en particular, un problema puede
admitir más de una solución satisfactoria, donde existen soluciones factibles o probables
y una o más que se revela como óptima.
El diálogo de la Figura 2.10 se genera por la interacción entre el CircSim y un alumno

real de prueba. Si bien el sistema guía por medio de una serie de pistas [Hume, 1995] al
alumno, la solución buscada del problema planteado es única [Bhatt et al., 2004].
T: What are the determinants of Stroke Volume?
S: CO, HR
T: It is true that CO=SV*HR, but what I am asking is what determines how
much blood is ejected from the heart each time it beats (the sv)?
S: VENTRICULAR FILLING
T: Do you know what parameter in the prediction table determines filling?

S: CVP
T: Right, Central Venous Pressure determines filling, therefore determines
Stroke Volume.
T: The other determinant is neurally controlled. What is the other
determinant of Stroke Volume?
S: TPR
T: No, Total Peripheral Resistance is not a determinant. Stroke Volume is
determined by Central Venous Pressure and Inotropic State.
Figura 2.10: Ejemplo de interacción del sistema CircSim [Hume, 1995]. T es la pregunta generada por el
tutor y S es la respuesta del estudiante usuario del sistema.
Lo que determina el volumen de un latido del corazón es la presión central venosa y el

estado inotrópico. Independientemente de la capacidad del alumno para encontrar una
respuesta a la pregunta, o si requiere una intervención activa por parte del STI, la
respuesta permanece única; y cada paso que se da, acerca al alumno un poco más a la
solución. Si bien pueden aparecer metas secundarias, el problema se considera resuelto
cuando se responden todas las metas (primaria y secundaria).
En el Figura 2.11 se puede ver la solución a un problema simple de la materia

Algoritmos I de la Facultad de Ingeniería de la UBA. La solución para hallar el factorial
de un entero positivo puede ser alcanzada por medio de métodos iterativos (usando
varias estructuras posibles) o de métodos recursivos. En ambos casos, la solución es
completamente válida, lo que dificulta entender el estado del alumno y el camino que su
solución particular seguirá desde la perspectiva del CircSim.
function fact (n:integer):longint function fact(n:integer):longint
var
i:integer; begin
acum:longint; if (n=0) then
begin factorial:=1
acum:=1;
for i:=1 to n do else
acum:=acum*i; factorial:=n*factorial(n-1);
factorial:=acum; end;
end;
Figura 2.11: Solución del problema factorial tanto en forma recursiva como en forma iterativa .
2.4.3 – STI Orientados a la Enseñaza de Lenguajes de Programación.
Se han desarrollado varios tutores y asesores inteligentes para apoyar la enseñanza de

los lenguajes de programación [Castillo et al., 1998]. Se implementaron y se observa
utilizan distintas arquitecturas base, que se detallan a continuación con sus
características más sobresalientes.
El primer sistema tutor inteligente orientado a la enseñanza de programación es Meno

[Wolf, 1984], estaba específicamente orientado a la enseñanza de programación en el
lenguaje Pascal.
El sistema Meno utiliza una serie de “plantillas” que representan las soluciones posibles
al problema planteado. Además contiene una base de datos con los errores más comunes
que realizan los estudiantes, para poder reconocerlos a través de un análisis del código
fuente. De acuerdo a los errores encontrados, se le presentan al alumno una serie de
sugerencias para corregir el programa, indicándole además, cuales son las causas de su

error y que conceptos aplicó en forma incorrecta o conceptos que desconoce [Castillo et
al., 1998]. Por otra parte, el tutor Proust de Carbonell [Carbonell, 1970] puede analizar
completamente el código fuente sin necesidad de utilizar plantillas como el Meno para
identificar las soluciones posibles.
El Proust posee una innovación que es el “diagnóstico de intenciones” [Johnson, 1986].

Esto significa que el asesor es capaz de deducir las metas del usuario y compararlas con
el código que analiza, lo que permite detectar errores no triviales en la lógica de
programación. Esta característica se extendió luego a otros dominios, fuera del asesor
Proust, por su gran utilidad.
Otro ejemplo de asesor inteligente orientado hacia la enseñanza de lenguajes de

programación, es el Coach (Cognitive Adaptive Computer Help) [Selker, 1989]. En él la
asistencia al estudiante se ofrece en forma de un ambiente interactivo de ayuda, donde
el estudiante proporciona un programa LISP como entrada y el asesor le ofrece
información relevante [Castillo et al., 1998].
La innovación que presenta Selker [Selker, 1989] en el Coach, es la de un ambiente de

ayuda interactiva y con un modelo del estudiante adaptativo en el cual se tienen en
cuenta parámetros tal como la tasa de cambio del alumno. De esta manera el sistema va
evolucionando cuando el estudiante aprende y recibe distintos tipos de asesorías,
dependiendo del grado de conocimientos previos del estudiante. Además Coach
demostró que el modelo de dominio era lo suficientemente adaptable para soportar
dominios similares, como es el caso de la enseñanza de los comandos del sistema
operativo UNIX.
Por lo tanto Coach [Selker, 1989] logró crear ayuda personalizada a cada uno de los
estudiantes usuarios y por medio de la observación de las acciones del usuario se
construye el modelo adaptativo del estudiante. Para describir a los estudiantes (usuarios
en el sistema Coach) Selker utilizó diversos modelos de usuarios, representados por
medio de “frames adaptativos”. Luego comparó los resultados entre los estudiantes
“asistidos” con el Coach y los estudiantes no asistidos para medir el éxito del Coach
como asistente de programación.
Otro tutor de Lisp es el ACTP [Russell et al., 2003] y es uno de los precursores en el uso
de modelado cognitivo en los Sistemas Tutores Inteligentes (STI) [Russell et al., 2003],
pero no llega a ser un asesor inteligente completo. Utiliza “plantillas de comparación”,
que son librerías de código común, para encontrar los errores que cometen los
estudiantes a la hora de escribir código fuente en Lisp. Este sistema podía detectar
pequeños, pero comunes, errores en código Lisp, con lo cual mejoró el conocimiento
global de los estudiantes.
El Tutor Capra de Fernández [Fernández, 1989] es otro tutor inteligente utilizado para
la enseñanza de programadores novatos; fue desarrollado dentro del marco de la
investigación del diagnóstico y detección de errores en entornos de programación. Este
tutor propone lidiar con esta problemática antes mencionada, mediante un tutor
inteligente que posea las siguientes características:
· Clasificación heurística de los errores.

· Análisis del flujo de datos.

· Ejecución Simbólica
Una de las características más importantes que se puede observar en el Capra es que
esta construido en castellano, ya que fue desarrollado en España. Este es uno de los
primeros intentos para desarrollar un asesor inteligente en el idioma español.
2.4.4 –Falencias de los STI Orientados a la Programación
El proyecto Meno Tutor [Wolf, 1984] comenzó a finales de los setenta en la

Universidad de Massachussets en Amherst, y su principal objetivo radicaba en el
diagnóstico de los errores de tipo “no sintácticos” en programas simples en Pascal, para
conectar estos errores con los “conceptos erróneos” que subyacían en la mente del
estudiante.
Para lograr esto, el Meno Tutor utilizaba un sistema de plantillas, donde las soluciones
posibles a un determinado problema estaban estandarizadas y el sistema verificaba en
cuál de estas planillas podía encajar de forma satisfactoria la resolución diagramada por
el estudiante. De acuerdo a los errores encontrados según las planillas, se le presentan al
alumno una serie de sugerencias para corregir el programa, indicándole además, cuáles
son las causas de su error y que conceptos aplicó en forma incorrecta o conceptos que
desconoce [Castillo et al., 1998].
Más tarde apareció el tutor llamado Meno-II Tutor, también en la Universidad de

Massachussets [Wolf, 1984] que estaba orientado al diagnóstico y análisis de las
estructuras repetitivas, pero con la misma base original que tenía el Meno Tutor
original. En esta nueva versión se agregó un módulo denominado “Bug Finder” que se
encargaba de analizar el programa del estudiante dentro de un árbol de la solución
propuesta y lo comparaba con un árbol almacenado que describía la solución de una
manera mucho más sencilla. Esto es una mejora con respecto al uso de plantillas, pero el
esquema continúa siendo demasiado rígido para poder encontrar los errores para una
solución cualquiera con respecto a la solución factible.
Otra de las desventajas de los tutores Meno radican en lo observado por Soloway y
Johnson [Johnson et al., 1986] donde no existían estudios empíricos para generar el
conocimiento de la programación que tenía el estudiante, es decir, no existía un módulo
respectivo en forma definida. Esta carencia no deja ver las diferencias entre los
programadores novicios y los expertos, quienes pueden adaptar las estructuras aplicadas
en otros lenguajes (como C o C++) a la resolución del problema original.
Es en este contexto que aparece el Tutor Proust de Carbonell [Carbonell, 1970] que
puede analizar completamente el código fuente sin necesidad de utilizar plantillas como
el Meno para identificar las soluciones posibles.
Luego de analizar las debilidades de los Meno Tutor, el nuevo Tutor Proust reconsidera
el problema del análisis de los programas y agrega conocimiento de la base de cada uno
de los estudiantes, quedando algo más definido de esta manera el módulo del estudiante.
A diferencia del Meno Tutor, el Proust está menos interesado en explicar los orígenes
de los errores en la programación que en solucionarlos, por lo tanto posee una estructura
más similar a un consejero que a un verdadero tutor.

Luego, los métodos de diagnóstico de errores fallan en reconocer problemáticas de tipo

no sintácticos que no son una propiedad intrínseca del programa erróneo, pero son
satisfactorios para detectar las intenciones del estudiante programador con respecto a las
estructuras y funciones.
Se definió entonces, al “diagnostico de intenciones” como la gran innovación del Proust

[Johnson, 1986]. Esto significa que el asesor es capaz de deducir las metas del usuario y
compararlas con el código que analiza, lo que permite detectar errores no triviales en la
lógica de programación. Esta característica se extendió luego a otros dominios, fuera del
asesor Proust por su gran utilidad.
Como contrapartida, el tutor Meno realizaba una comparación entre las funciones y
estructuras esperadas y las entregadas por el estudiante. El acercamiento del Proust, por
otro lado, realiza un diagnóstico sobre el proceso de diseño que distingue tres niveles
distintos:
· Primero, la especificación del problema, que da origen a una meta final y a

una serie de submetas.
· Segundo, una vez establecidas las metas del problema se generan los planes
posibles para encontrar una solución.
· Tercero, se implementaba el código para resolver el problema conforme a
los planes establecidos.
De esta manera, se producen informes de cada uno de los errores de los alumnos mucho
más precisos, ya que se conocen los distintos pasos mentales que el estudiante daba para
hallar la resolución del problema. Por lo tanto, el Proust busca la interpretación más
plausible para el programa respecto a las especificaciones dadas y luego puede llegar a
inferir un diseño posible que se adecua a las intenciones del estudiante programador
novato. Esto le da la capacidad, al Proust, de poder detectar las diferencias entre un
error en el programa, con su correspondiente error conceptual, y el código fuente
inusual, pero en forma correcta.
Tampoco existe dentro del Proust una definición básica de los módulos fundamentales
propuestos por Carbonell [Carbonell, 1970], esto se debe a que generar un sistema tutor
inteligente es un proceso largo y delicado, donde se deben tener en cuenta aspectos que
corresponden a distintas áreas del saber, como puede ser la mejor codificación, en el
área de la programación y el estilo de aprendizaje del alumno, perteneciente al área
educativa, o los diseños de interfaces, para hacer llegar de manera correcta la
información al usuario del sistema, perteneciente al campo del diseño gráfico.
Otros Tutores Inteligentes, como el Bridge, son derivados del Meno y del posterior
Proust se basan en el estudio de los errores típicos de programación y se considera el
conocimiento inicial lingüístico que conlleva el aprendizaje de un nuevo lenguaje de
programación. Al tutor Bridge no se le ha agregado un sistema de diagnóstico eficiente
y en su lugar se utiliza un sistema más empírico que se desprende de los resultados
obtenidos del tutor Proust, ya que estos tutores son muy similares. Vale la pena resaltar
el caso del Tutor Capra de Fernández [Fernández, 1989] que es otro tutor STI, para el
diagnostico y detección de errores de programación. Éste es uno de los primeros
intentos para desarrollar un asesor inteligente en idioma español.

Ahora, tanto el Proust como el Meno Tutor, así como todos sus derivados, no son
Sistemas Tutores completos, ya que no presentan los nuevos contenidos, sino que solo
analizan los resultados de los conocimientos ya adquiridos por el estudiante y le
muestran los errores y le proporcionan una solución aceptable, esto coincide con la
forma de explicar los nuevos conceptos en forma socrática, soportada por la Teoría Uno
[Perkins, 1995], pero carece de una forma para modificar el protocolo pedagógico
conforme a las características de cada uno de los estudiantes, como pueden ser los
estudiantes novatos y los estudiantes que poseen una base de programación. En la Tabla
2.7 se pueden ver algunas de las características de los distintos tutores aplicados a la
enseñanza de la programación básica.
Método para
Tutor Estructura Proceso de Búsqueda Especialidad
detectar errores
Posee “creencias” acerca Las “creencias” del
del domino de aplicación sistema se obtienen de
El grafo se construye de manera
Construye un grafo y con respecto a la una base de datos y se las
bidireccional, propagando las
Advisor de dependencia de
restricciones que se derivan de una
solución planteada y el compara con los posibles
conceptos dialogo se realiza en caminos a tomar para la
tabla de datos.
términos de estas resolución de un
“creencias” ejercicio.
Esquema organizado Utiliza un proceso en línea de Realiza todos los análisis Esquema de errores
dentro de una ensayo de las expectativas del con respecto a los estandarizados y los
Flow estructura activa de sistema y su posterior estudiantes en línea, sin disparadores que pueden
red. confirmación (o no) demoras o retrasos. generar estos errores.
Es capaz de interactuar Utiliza el “bug finder”
Posee dos fases: primero construye entre múltiples metas u que consiste en una serie
un conjunto de hipótesis en forma objetivos planteados y de reglas para detectar
Posee una jerarquía
de una búsqueda Top-Down, luego forma la base de los errores. Como en Meno
de objetivos y le
Proust agrega los planes
realiza un análisis diferencial que Sistemas Tutores II, genera hipótesis de los
tienen en cuenta las intenciones Inteligentes como uno de posibles errores del
para cumplirlos
del estudiante asi como también de los tutores mas utilizados estudiante acerca del
errores estandarizados en ambientes educativos dominio por medio de
reales. casos almacenados.
Incorpora aspectos
La estructura de los globales en el proceso de
Utiliza el árbol de las
distintos planes se Depende de la “visión” lingüística diseño de algoritmos.
soluciones para comparar
Spade ve como un árbol y del plan, el que sugiere las Esto adiciona
la solución probable del
se analiza con un variedades de técnicas de parsing. condicionamientos que
estudiante.
parser. son puramente técnicos
(no del lenguaje)
Tabla 2.7: Características de los primeros STI orientados a la programación

Capítulo 3 - Descripción del Problema
3.1 – Definición Detallada del Problema
El problema en el que se basa esta investigación, como ya se señaló en la introducción,

se centra en el bajo porcentaje de alumnos que aprueban las materias de Programación
Básica en las distintas carreras de Ingeniería.
La investigación se centrará en el problema de las materias del área de docencia

correspondiente a Programación Básica (tales como Algoritmos y Programación I y
Computación) de la Facultad de Ingeniería de la Universidad de Buenos Aires que se
basan en la resolución de problemas reales aplicando el paradigma de programación
lineal estructurada.
Algoritmos y Programación I (Código 75.40) corresponde a las carreras de Ingeniería

Informática y Licenciatura en Análisis de Sistemas y Computación (Código 75.01) es
una materia común a todas las carreras de ingeniería con excepción de Ingeniería
Electrónica e Informática.
Las encuestas de satisfacción realizadas en los cursos citados donde el tesista es docente
auxiliar, durante el periodo 2002-2004 evidenció que antes de comenzar con el dictado
de las clases el 10% de los alumnos utilizaban algún lenguaje de programación, y de ese
porcentaje, solo el 3% conocía lenguajes donde se puede aplicar el paradigma lineal
estructurado en la forma que requiere la materia. Luego de la interacción con los
alumnos a lo largo de seis cuatrimestres, se ha observado que estos porcentajes se
mantienen, por lo que se puede concluir que los alumnos no poseen un conocimiento
previo de los lenguajes de programación y mucho menos del paradigma lineal
estructurado.
Por otra parte, durante los seis cuatrimestres en estudio se efectuó el seguimiento de los
alumnos (a través de sus evaluaciones parciales y finales) a fin de saber por qué algunos
de ellos no llegaban a aprobar la materia en tiempo y forma. En esta Universidad, como
en otras, con asignaturas equivalentes en carreras relacionadas con la Informática y
Sistemas es preocupante la baja cantidad de alumnos que aprueban la materia. En la
mayoría de los casos este índice está en el orden del 30% [Madoz et al., 2000; Bruno,
2003].
Según Guardia Robles [Guardia Robles, 1993] para la enseñanza de los lenguajes de
programación, los profesores tienen como objetivos básicos que los alumnos adquieran
los conocimientos necesarios para desarrollar programas y sistemas computarizados que
resuelvan problemas reales.
En la enseñanza de la Programación Básica existen diversos factores que se pueden

relacionar a la problemática del bajo rendimiento académico de los estudiantes. Entre
los factores mencionados se pueden destacar los relacionados al docente y al alumno.
Entre los problemas atribuibles al docente (sobre todo los novatos) se debe tener en
cuenta el desconocimiento de los distintos métodos de enseñanza y la falta de manejo de
DESCRIPCIÓN DEL PROBLEMA Fernando A. Salgueiro 87

las herramientas didácticas. También se evidencia la escasa base teórica para llevar al
alumno hacia un cambio conceptual de sus errores.
En este sentido, Guardia Robles [Guardia Robles, 1993] sostiene que: “Se ha dado
demasiado peso al papel del profesor como transmisor, y menor al del alumno como
receptor”, desde la visión tradicional que consideraba al docente como único transmisor
de los conocimientos.
Entre los problemas que se pueden atribuir al alumno se incluyen, las actitudes
negativas de algunos de ellos hacia el aprendizaje, el desconocimiento de metodologías
que les permitan encontrar las formas más apropiadas para evaluar las soluciones
propuestas y las maneras para optimizarlas. Por otra parte, durante las clases de práctica
en el laboratorio se observa que el tiempo para trabajo en máquina siempre es escaso,
debido a que los recursos disponibles deben ser compartidos entre los grupos de trabajo.
Se intentaron varios acercamientos para solucionar este problema, utilizando

herramientas didácticas (foros de discusión, clases prácticas con computadora y cañón,
clases en la sala de máquinas, etc.) ninguna logrando modificar sustancialmente los
resultados antes descriptos en una manera aceptable. Por lo tanto, los bajos porcentajes
de alumnos aprobados en los cursos de Programación Básica hicieron pensar en una
nueva perspectiva orientada a facilitar el aprendizaje de un modo más flexible centrada
en el diseñote un tutor adaptable a las preferencias de los estudiantes.
3.2 – Definición de los Objetivos de la Tesis
3.2.1 – Objetivo General
El objetivo general de esta tesis se puede expresar como:
Proponer un modelo de tutor inteligente que sea capaz de adaptarse a las necesidades y
preferencias de los alumnos, según sus estilos de aprendizaje, para proveerles de una
herramienta adicional a través de la cual puedan recibir tutorizado “uno a uno”
independientemente del tiempo y la distancia en que éstos se encuentren.
Para lograr el objetivo general, se requiere de los objetivos específicos que se enumeran
a continuación.
3.2.2 – Objetivos Específicos
· Determinar el estado actual de las investigaciones en el tema del tutorizado

humano e inteligente, relevantes para la tarea que desempeña el módulo
correspondiente al tutor en un Sistema Tutor Inteligente (STI).
o Establecer los fundamentos que sustentan las teorías seleccionadas.
o Seleccionar los componentes del módulo del tutor, mediante el uso de

submódulos, que permitan guiar a los estudiantes en el proceso de
aprendizaje de manera de poder responder a sus necesidades.
88 Fernando A. Salgueiro DESCRIPCIÓN DEL PROBLEMA

· Modelar el subsistema tutor enmarcado dentro de la arquitectura de los

Sistemas Tutores Inteligentes (STI), con sus submódulos e interfaces,
utilizando las herramientas que provee la Ingeniería de Software y la
Inteligencia Artificial (IA).
· Validar el modelo planteado con datos característicos de los alumnos, tales

como los estilos de aprendizaje y el rendimiento académico.
3.2.3 – Preguntas de Investigación
A partir de los objetivos específicos, se desprenden una serie de interrogantes que deben
ser respondidos para que el objetivo general pueda ser cumplido. Se pueden formular de
la siguientes preguntas de investigación:
Pregunta 1: ¿Cuál es la herramienta más adecuada para la toma de datos

representativos de las necesidades y preferencias de los estudiantes y el
procesamiento de los mismos?
Pregunta 2: ¿Cuál es el tamaño muestral mínimo para que el error de generalización

sea lo suficientemente pequeño como para que los resultados puedan
generalizar a toda la población de alumnos?.
Pregunta 3: ¿En cuántos grupos o familias pueden organizarse los datos relevados de
los alumnos? ¿Es este número aceptable para una relación lineal con los
distintos protocolos pedagógicos?.
Pregunta 4: De todos los atributos relevados por la herramienta (planilla de toma de

datos): ¿Cuáles de ellos tienen una mayor ganancia de información? Y a su
vez, ¿Cómo quedan expresados los grupos o familias en función de los
atributos más relevantes?.
Pregunta 5: La información requerida para determinar el protocolo pedagógico del

estudiante: ¿estará disponible en el módulo del estudiante o deberá
agregarse a la estructura general de un Sistema Tutore Inteligente (STI) un
nuevo submódulo para relevar y procesar la información requerida?.
Pregunta 6: ¿Cada uno de los grupos o familias en las que los estudiantes se unen
pueden ser relacionadas con un protocolo de enseñanza específico? Si la
respuesta es afirmativa: ¿Con qué protocolo están relacionados?.
Pregunta 7: ¿Cómo reacciona la estructura de la solución propuesta en el caso en que el

protocolo pedagógico requerido por el sistema se encuentre faltante
parcialmente (en algún tema) en el módulo del dominio?.
Pregunta 8: ¿Cómo se adapta la solución propuesta al uso de las nuevas tecnologías de

la información y comunicación (NTIC)?
Pregunta 9: ¿Qué impacto global tiene la propuesta en el marco especifico de los

Sistemas Tutores Inteligentes (STI)?.

3.3 – Límites y Restricciones del Trabajo
Ya se ha señalado que el campo de los Sistemas Tutores Inteligentes (STI) es muy

amplio y muchas de sus aplicaciones reales recién comienzan a tomar forma hoy día,
como son los Asistentes Inteligentes, los Sistemas Tutores Inteligentes Multiagentes
Distribuidos y los Sistemas Tutores Inteligentes basados en la Web que utilizan las
nuevas tecnologías disponibles. Ante la diversidad de opciones posibles en esta
investigación se limitará el campo de aplicación como se detalla en los párrafos
siguientes.
Para este trabajo se considerará el modelo básico de componentes planteado por

Carbonell [Carbonell, 1970] con tres módulos básicos (módulo del tutor, del estudiante
y del dominio) y sus rediseños posteriores [Salgueiro et al., 2004; Salgueiro et al., 2005;
Costa et al., 2004; García-Martínez et al., 2004; Cataldi et al. 2004]. No se
contemplaran los modelos netamente experimentales y con poca cantidad de prototipos
implementados, tal como puede ser el modelo planteado por Self [Self, 1998], expuesto
anteriormente en el Estado del Arte.
Se optó por utilizar la arquitectura de Carbonell [Carbonell, 1970] debido a que es la

base de la mayor parte de los desarrollos en todo el mundo y se adapta a la propuesta de
modelado del sistema tutor. Las arquitecturas que definen el resto de los investigadores
son experimentales y muy pocos de los tutores que las utilizan han sido probados con
estudiantes fuera de los casos de laboratorio.
La estructura clásica de Carbonell, como ya se dijo, ha sido implementada en muchas

ocasiones, siendo los resultados más tangibles los Sistemas Tutores Inteligentes (STI):
Scholar [Carbonell, 1970], Why [Stevens et al., 1977], Sophie [Brown et al., 1989],
Guidon [Clancey et al., 1991], West [Burton et al., 1981], Buggy [Brown et al., 1989],
Debuggy [Brown et al., 1989] Steamer [Stevens et al., 1977], Meno [Wolf, 1984],
Proust [Johnson et al., 1984], Sierra [VanLehn, 1988], Andes [Gertner et al., 1998] y el
CircSim [Kim, 1989; Kim, 2000; Cho, 2000; Hume, 1995; Shah, 1997; Hume et al.,
1992] entre otros.
Por otra parte, los Sistemas Tutores Inteligentes (STI) analizados pueden responder a las
preguntas de los usuarios estudiantes, siempre y cuando la interacción esté iniciada por
el sistema, ya que éste debe realizar un proceso guiado de aprendizaje. En el caso en
que la interacción sea iniciada por el estudiante, el sistema no puede conocer de
antemano los objetivos a cumplir y por lo tanto no puede establecer el mejor camino
para llegar a ellos. Este tipo de interacciones, entonces, no se tendrán en cuenta para el
análisis de los distintos submódulos en la estructura del módulo del tutor dentro del
esquema de los Sistemas Tutores Inteligentes (STI).
Se pueden destacar varios Sistemas Tutores Inteligentes (STI) que se adaptan a la

restricción de no aceptar interacciones no guiadas o iniciadas por el estudiante usuario:
Scholar [Carbonell, 1970], Why [Stevens et al., 1977], Sophie [Brown et al., 1977],
Guidon [Clancey et al., 1988], West [Burton et al., 1981], Buggy [Brown et al., 1989],
Debuggy [Brown et al., 1989] Steamer [Stevens et al., 1977], Meno [Wolf, 1984],
Proust [Johnson et al., 1984], Sierra [VanLehn, 1987], Andes [Gertner et al., 1998] y el
CircSim [Kim, 1989; Kim, 2000; Cho, 2000; Hume, 1995; Shah, 1997; Hume et al.,
1992] entre otros.

Para diseñar e implementar un Sistema Tutor Inteligente (STI) que soporte la iniciativa
del alumno se requiere de un análisis adicional para detectar los patrones de
comportamiento y los casos particulares en que sus iniciativas pueden encontrar (o no)
situaciones útiles para lograr un objetivo dentro del marco del aprendizaje.
En consecuencia, las interacciones iniciadas por el estudiante usuario no serán

contempladas, por lo que esto no impactará en los distintos marcos teóricos utilizados,
como lo son la instrucción didáctica (que expande el repertorio de conocimientos del
alumno), el entrenamiento (que satisface la necesidad de asegurar una práctica efectiva)
y la enseñanza socrática (cuyo objetivo es ayudar al alumno a comprender ciertos
conceptos por sí mismo y darle la oportunidad de investigar y de aprender cómo
hacerlo). Todas ellas están dentro del marco teórico de la Teoría Uno [Perkins, 1995].
Por lo tanto, se analizará la integración de la Teoría Uno dentro del marco de los
Sistemas Tutores Inteligentes (STI) y la forma en que el sistema deberá responder a
cada uno de los distintos perfiles de los estudiantes de acuerdo a su estilo de
aprendizaje, realizando la menor cantidad de indagaciones a fin de obtener buenos
resultados para la sesión pedagógica con respecto a los recursos disponibles en el
sistema (en el módulo del dominio).
3.4 – Recursos Necesarios.
En esta sección se detallan los recursos necesarios para llevar a cabo la tesis. Se tratan
de recursos bibliográficos, tecnológicos y humanos.
Debido al desarrollo de la tesis centrada en un modelo computacional, se requirió de

tecnología de computadora de última generación para correr las diferentes las redes
neuronales, que insumen una cantidad de tiempo considerable debido a que se deben
ajustar los distintos parámetros.
También, el carácter interdisciplinario de la tesis, requiere tanto de conocimientos

pertenecientes al área de la Inteligencia Artificial (IA) como también de las Ciencias de
la Educación: tales como las teorías de aprendizaje, de enseñanza y la psicología
educativa, esto incrementó el número de consultas a los materiales bibliográficos
específicos de un área que inicialmente estaba fuera de las previsiones del tesista
durante su carrera, por lo que se requirió de una formación adicional en este dominio en
particular.
3.4.1 – Recursos tecnológicos
Básicamente, los recursos tecnológicos utilizados son los necesarios para el

entrenamiento de las redes neuronales y la confección del informe de tesis. Como se
mencionó en el párrafo anterior, el entrenamiento de las redes es una tarea costosa a la
hora de medir tiempos, ya que se requiere de cientos y hasta miles de ciclos de
entrenamiento para una red, a fin de poder evaluar el error de entrenamiento que la
misma posee. Cuando el error es inaceptable (mayor al 5%), se debe descartar la red. De
este modo se debe comenzar el proceso de entrenamiento nuevamente, variando los

distintos parámetros que la definen (entre los que se pueden citar el parámetro de
aprendizaje a (el valor inicial y el régimen de modificación a lo largo de los ciclos), el
momentum b, los pesos aleatorios iniciales, el vecindario gaussiano, la cantidad de
atributos que se utilizarán para el entrenamiento, la cantidad de las observaciones que se
utilizarán y las que se descartaran, justificando por qué se descartarán).
En promedio, el tiempo de entrenamiento de una red neuronal para los valores utilizados
en esta tesis es de aproximadamente 1.5 horas. Se entrenaron redes con más de 600
variaciones en los parámetros hasta encontrar los adecuados y los valores mínimos
correspondientes al error, lo que da un tiempo total neto de 38 días de entrenamiento.
Este proceso no puede realizase en forma completamente automática ya que es el tesista
quien debe variar los distintos parámetros y evaluar los resultados en cada caso. Los
recursos utilizados se enumeran a continuación:
· Computadoras el entrenamiento de la red: Básicamente se utilizó una:

o PC INTEL Pentium 4 de 2.4 GHz, con HDD de 120GB y 1024MB de RAM
o Servidor INTEL Pentium 4 de 2.4 GHz c/u, HDD de 120 GB y 2 GB de RAM
· Computadora para la confección del documento de la tesis: PC AMD 2600+

de 2.1GHz, con HDD de 120GB, 512MB de RAM.
o Con Impresora: Lexmark Z31.
o Con Procesador de texto Microsoft Word 2004 y Planilla de cálculo para la
trascripción de planillas, notas, etc: Microsoft Excel 2004.
· Implementación de redes utilizadas: Aplicaciones creadas por Angshuman

Saha, en el John F. Welch Technology Center (Bangalore, India) y de uso y
distribución gratuitas.
o NNClust: Agrupador basado en SOM.
o NNClass: Clasificador basado en BackPropagation.
o Ctree: Algoritmo de Inducción basado en C4.5.
3.4.2 – Recursos Bibliográficos
Básicamente se utilizaron los recursos bibliográficos provistos por la biblioteca central

de la Facultad de Ingeniería de la Universidad de Buenos Aires, además de la Biblioteca
del Instituto Tecnológico de Buenos Aires y el acceso a Centros de Investigación
disponibles a través de Internet de la SeCyT para comunicaciones a eventos
internacionales y revistas especializadas, que son citados en la sección de Bibliografía.
Se debe resaltar que los recursos bibliográficos concernientes a educación fueron
consultados en la Biblioteca Nacional de Maestros de la Ciudad de Buenos Aires, en la
Biblioteca del Congreso Nacional y muchos de los libros fueron aportados al tesista por
la Mg. Ing. Zulma Cataldi. Además, se accedió al material educativo de Universidades
que disponen de Bibliotecas Virtuales en el área (como por ejemplo Sevilla y
Barcelona) por medio de Internet.

3.4.3 – Recursos Humanos
Dado que el proyecto es desarrollado por una sola persona, el tesista, tanto la
planificación de las pruebas, el análisis de los resultados, las transcripciones y
codificación de las planillas y notas, la compaginación, la comparación de los resultados
y el entrenamiento de las redes han sido realizadas por la misma persona con la guía de
los directores. Debido a que las planillas para la toma de datos (los estilos de
aprendizaje) requieren de alumnos para la toma de los datos básicos se requirió:
· Una muestra de estudiantes que cursasen materias del área de Programación

Básica dispuestos a completar de forma fehaciente las planillas de estilos de
aprendizaje para ser tomadas como los datos de entrada de las distintas redes
neuronales, tanto para el entrenamiento de la red como para su validación. Por
otra parte, de acuerdo a la matrícula de estudiantes se calculó el número mínimo
de alumnos a relevar para mantener acotado al error de generalización por
debajo de valores aceptables (entre 3 y 5 %). En la sección 5.3.2.- validación del
modelo se pueden ver los detalles del cálculo del tamaño muestral.
· Dos cursos en los que se dicten las materias del área de Programación Básica y
que los docentes se puedan asimilar a dos de las formas básicas de enseñanza
que estipula la Teoría Uno de Perkins [1995]. Las distintas formas de enseñanza
de la Teoría Uno se encuentran detalladas en la Sección 2.3.3.4.2 - Técnicas
educativas aplicables.

Capitulo 4 – Solución Propuesta
4.1 – Establecimiento y Justificación de la Solución.
Para obtener un Sistemas Tutores Inteligentes (STI) verdaderos, con módulos

intercambiables, se debe partir del modelo tripartito propuesto por Carbonell
[Carbonell, 1970] sin solapamiento de funciones. De este modo se obtendrán módulos
intercambiables que pueden interactuar entre si. Se piensa entonces en módulos
independientes con interfaces completamente definidas, de modo tal que puedan
intercambiarse, por ejemplo el dominio, sin necesidad de modificar el resto de la
estructura del Sistema Tutor Inteligente (STI).
Para el caso en que se plantea la solución, se ha tomado como dominio de aplicación el

correspondiente al área de Programación Básica. El módulo del tutor debe diseñarse de
tal modo que pueda brindar una solución adecuada a los problemas descriptos en el
capítulo anterior que presentan los estudiantes. También es deseable mostrar los
contenidos de cada una de las sesiones pedagógicas utilizando la mayor cantidad de
recursos didácticos como lo señala Guardia Robles [Guardia Robles, 1993].
Algunos investigadores presentan una estructura teórica [Carbonell, 1970; Salgueiro et

al., 2004; Costa et al., 2004] que difiere de la real implementada en los Sistemas
Tutores Inteligentes (STI). La diferencia entre la descripción teórica y la implementada
se debe a que no están bien diferenciadas las distintas interfaces. Se observa que
muchos de los conocimientos particulares del dominio (pertenecientes al módulo de
dominio) se encuentran dentro de los módulos del tutor y del estudiante tal como se
observa en la Figura 4.1 existiendo zonas de solapamiento entre módulos.
Modulo
Dominio Modulo
Dominio
Modulo Modulo
Tutor Estudiante Modulo Modulo
Tutor Estudiante
Interfaz Interfaz

Figura 4.1: Diferencias entre el esquema teórico de un Sistema Tutor Inteligente y su versión final
implementada. En la Figura 4.1.a: Se puede ver el esquema de un Sistema Tutor Inteligente Teórico,
mientras que en la Figura 4.1.b: Se ve el esquema de un Sistema Tutor Inteligente real (implementado)
con solapamiento de los módulos.
94 Fernando A. Salgueiro SOLUCION PROPUESTA

Algunos Sistemas Tutores Inteligentes que presentan superposiciones son: el tutor

CircSim (simulador de la PhD Evens y los médicos Michael y Rovick) [Kim, 1989;
Kim, 2000; Cho, 2000; Hume, 1995; Shah, 1997; Hume et al., 1992] en el campo de la
medicina y los tutores Meno [Wolf, 1984] y Proust [Johnson, 1986] desarrollado para el
área de la informática, ya que son tutores para el apoyo de la enseñanza de lenguajes de
programación.
Existen también otros problemas en las implementaciones de los Sistemas Tutores

Inteligentes (STI), ya que muchas funciones están relacionadas tanto al módulo tutor
como al módulo del estudiante. Por ello, se debe identificar qué módulo será el
encargado de realizar cada una de las funciones del Sistema Tutor Inteligente (STI) a fin
de que éste quede definido en su totalidad. De este modo se lo podría desarrollar a
través de módulos completamente intercambiables e independientes del dominio de la
aplicación.
La definición de cada una de las tareas particulares de los módulos, permite realizar
agrupamientos de tareas en cada uno de ellos. A estos agrupamientos se los definirá
como submódulos pudiéndose realizar un análisis similar al de los grandes bloques del
sistema tutor inteligente, definiendo sus funcionalidades básicas y sus interfaces, para
permitir la independencia de los submódulos.
Un entorno de desarrollo (framework) para la implementación de los Sistemas Tutores

Inteligentes (STI), debe permitir la reusabiliadad de código, como plantean El Sheikh y
Sticklen [El Sheikh et al., 1998] entre otros. De acuerdo a lo planteado en la descripción
del problema, en el modelo planteado el estudiante usuario debe comprender un tópico
en particular y el sistema tutor inteligente debe adaptarse de acuerdo a las sus
necesidades y preferencias. Es decir, se trata de un modelo de tutor adaptable.
Los sistemas tutores inteligentes están en desarrollo desde hace más de quince años,
pero muy pocos realizaron la transición hacia el mercado comercial. Esta imposibilidad
de los STI para ser comercializados como productos de uso masivo se debe a:
· La dificultad inherente al desarrollo de un sistema tutor inteligente (STI), ya que

son proyectos multidisciplinarlos, al menos entre la ingeniería del conocimiento,
la ingeniería de software, la ciencias de la educación y el dominio particular en
el que se centra el sistema tutor. Esto da como resultado sistemas masivos, que,
por la falta de reutilización de los módulos y de interfaces compatibles requieren
que se comience un nuevo desarrollo desde cero para cada STI.
· El tiempo, para la planificación y el desarrollo de sistemas como los

mencionados, es de varios años, más otros tantos de puesta a punto con pruebas
piloto antes de salir como un producto comercial. Para cada Sistema Tutor
Inteligente (STI) se deben desarrollar todos los componentes, tanto particulares
para el domino como los componentes generales así como los módulos de tutor
y del estudiante.
· La relación Costo/Beneficio debe ser analizada para cada tutor, ya que todos los
módulos son desarrollados nuevamente para cada producto, deben ser probados
y debe ser evaluada la efectividad del modelo en cada caso, aumentando el costo
y el tiempo que insume el proyecto en forma global.
SOLUCION PROPUESTA Fernando A. Salgueiro 95

Se puede afirmar entonces que estos inconvenientes y argumentos, generan un problema

serio en los Sistemas Tutores Inteligentes (STI), pero no en cada caso particular, ya que
el problema reside en la metodología actual de desarrollo de este tipo de sistemas. El
problema es que pocas secciones de código o partes de un sistema tutor inteligente
pueden ser reutilizada por otro tutor. A esto se le suma que los módulos, no están bien
definidos y que el tutor inteligente está particularizado para un dominio especifico. Se
genera código de tipo “hard-coded”17 donde muchos de los elementos que no son
dependientes del dominio se encuentran dentro de cada uno de los módulos.
Por otra parte, se detecta una falta de lenguaje estándar para representar los
conocimientos en el módulo de conocimientos y de una interface que permita a las
distintas aplicaciones y a los distintos módulos acceder a ese conocimiento. Además, se
requiere desarrollar herramientas estandarizadas que permitan a los diseñadores de los
Sistemas Tutores Inteligentes (STI) manipular el conocimiento: obtenerlo y generar las
relaciones (de pertenencia, de correlatividad, de generalización, entre otras) con mayor
facilidad.
Las evidencias de las diferencias entre los modelos teóricos y los implementados surgen
en los planteos de Clancey y Joerger [Clancey et al., 1988] quienes se lamentan que
“...la realidad hoy es una empresa que solo experimentan los programadores” y la
mayoría del desarrollo teórico realizado en las últimas décadas no aportó mucho en
cuanto a la estandarización de los Sistemas Tutores Inteligentes (STI), ya que la mayor
parte de los investigadores se centraron en el desarrollo de tutores para aplicaciones
individuales o para aplicaciones muy dependientes del dominio.
Por otro lado, se puede ver que los Sistemas Tutores inteligentes (STI) son, en general,
construidos por programadores y profesionales del área de la informática que poseen
poca experiencia en el campo de las ciencias de la educación y teorías del aprendizaje.
Esto, en contraposición con el párrafo anterior, da como resultado sistemas que pueden
ser excelentes en términos de diseño, uso de recursos y rendimiento, pero que pueden
ser poco eficientes en la puesta en producción en un ambiente educativo real.
Por lo tanto, este trabajo surge motivado por las debilidades detectadas en el análisis y
la existencia de una falta de estandarización para generar Sistemas Tutores Inteligentes
(STI) reutilizables y de propósito general que puedan aplicarse a una gran diversidad de
dominios, en particular en lo referente al remodelado del módulo del tutor.
Tomando esta base se puede plantear la solución que se sustenta esta tesis. El problema
que se intenta solucionar se puede reformular entonces del siguiente modo: “Existe una
necesidad de desarrollar una arquitectura para los STI, de modo que sus componentes
puedan ser reutilizables por lo que se deberá contar con las herramientas apropiadas
de diseño (estandarizadas) que permitan desarrollar interfaces y submódulos con
funciones perfectamente definidas”.
17
Partes del código fuente que se encuentran “hard-coded” son partes que se definen de tal manera de
que no pueden ser modificadas sin recompilar todo el código fuente, a diferencia de los datos que se
obtienen del DBMS, bases de datos o sistemas mas primitivos de manejo de información.

Además de las necesidades de un mayor análisis sobre cada uno de los módulos
planteados por Carbonell [Carbonell, 1790] para desarrollar Sistemas Tutores
Inteligentes efectivos, éstos deben centrarse en las necesidades reales de los estudiantes
usuarios. Esto significa contar con los protocolos pedagógicos más adecuados de
acuerdo a las necesidades y las preferencias de cada usuario del sistema en particular
que tenga en cuenta la diferencia entre los distintos tipos de conocimientos a explicar: el
conocimiento declarativo, que incluye los hechos, conceptos y vocabulario y el
conocimiento procedural que incluye los pasos, las formulas y los algoritmos a utilizar
en la resolución de problemas. Es decir, la hipótesis principal se puede describir como:
“Un Sistema Tutor Inteligente (STI) que se adapte a las preferencias del estudiante este
obtendrá mejores resultados”.
A continuación se plantean de los submódulos y las interfaces que se proponen para

solucionar la problemática actual de los Sistemas Tutores Inteligentes (STI), de los
cuales se tomará el módulo del tutor para su modelado.
4.1.1 – Submódulos e Interfaces
Para el análisis se partirá del diagrama básico de los Sistemas Tutores Inteligentes (STI)
planteado por Carbonell [Carbonell, 1970] y Guardia Robles [Guardia Robles, 1993],
luego se ampliará ese esquema a los submódulos se ha detectado como faltantes
[Salgueiro et al., 2004] cuya falta ha sido comunicada por Cataldi [Cataldi et al., 2004],
por Costa [Costa et al., 2004] y por García-Martínez [García-Martínez et al., 2004]
planteando de este modo las necesidades básicas de cada submódulo y cómo estos
submódulos deben articularse entre sí para poder contribuir con partes completamente
independientes.
A pesar de los avances tecnológicos, el modelado de los Sistemas Tutores Inteligentes

(STI) sigue siendo una tarea compleja, ya que más allá de considerar los tres módulos
básicos de la arquitectura tripartita propuesta por Carbonell [Carbonell, 1970] se deben
tener en cuenta las interfaces, las comunicaciones entre los módulos y la gestión de la
información en los mismos. A la hora de modelar un STI se deben tomar en
consideración las características del dominio (o sea del contenido), del comportamiento
observable del alumno (modelos del alumno) y del conjunto de estrategias que serán
abordadas por el módulo del tutor en búsqueda de una enseñanza personalizada
(modelos de tutor).
Si bien el desarrollo de esta tesis solo abarca con profundidad el modelado del tutor, no
se deben dejar de lado los otros módulos, ya que los datos que recibe o envía el módulo
del tutor deben proceder de (o dirigirse a) alguna parte, ya que no todos provienen
directamente del usuario. Estos datos solo pueden provenir de las interfaces con los
otros módulos, porque en caso contrario habría solapamiento entre los módulos.
De este modo, mantener la estructura teórica no es suficiente para que quede definido el
sistema sin superposiciones. Hay que considerar el listado de funcionalidades de los
módulos para que no se realicen dos veces las mismas tareas. La división de los
módulos en funcionalidades puede evitar el solapamiento, como se verá en el apartado
4.1.1.2 – Componentes básicos de los Módulos.

Sistema Tutor Inteligente
Modulo Dominio Modulo Tutor Modulo Estudiante
Interfaz
Figura 4.2: Estructura clásica de un Sistema Tutor Inteligente propuesta por Carbonell [Carbonell, 1970].
Modulo Evaluador
Modulo Dominio
Parámetros del Elementos

Conocimiento
sistema Pedagógicos
Modulo del Tutor Modulo del Estudiante
Protocolos Pedagógicos Estilos de Estudiante
Analizador
Protocolos Estilos Clasificación
de Perfil
Pedagógico
Planificador de la lección Estado de Conocimiento
Generador Estado actual

Stack de Actualizador Stack
de de
de Objetivos Objetivos
Contenidos de estados conocimientos
Generador
de Lenguaje Evaluador Usuarios
Natural Estudiantes
Interfaz
Figura 4.3: Estructura de un STI, con la identificación de submódulos y un módulo evaluador.
En la Figura 5.2 se observa la estructura básica de un Sistema Tutor Inteligente (STI)

en forma teórica. Luego, la estructura del módulo del tutor se puede complementar con
la del módulo del estudiante planteado por Costa [Costa et al., 2005] y con el módulo de
evaluación planteado por Cánepa Paulín [Cánepa Paulín et al., 2004] en su plan de tesis
en función de la metodología propuesta por Cataldi [Cataldi et al., 2004].

4.2 – Análisis de los Submódulos
En los apartados siguientes se describen cada uno de los submódulos que se proponen
para el módulo del tutor. Se presentan las interfaces y las tareas especificas de cada uno
de los submódulos, comparándolos con los desarrollos actuales en los Sistemas Tutores
Inteligentes (STI) y se los ubica dentro de la estructura global del módulo del tutor.
4.2.1 – Submódulo Protocolos Pedagógicos
En la Figura 4.4 se puede ver el esquema general del submódulo de los protocolos
pedagógicos, con sus dos componentes básicos: el analizador de perfil y la base de
protocolos pedagógicos disponibles. Este submódulo interactúa, con el resto de los
submódulos del módulo del tutor y además es el que realiza las peticiones de los datos
al módulo del estudiante, para saber cuál es el perfil de éste y su estado de
conocimientos.
Protocolos Pedagógicos
Analizador
Protocolos
de Perfil
Pedagógico
Figura 4.4: Submódulo de Protocolos Pedagógicos
El submódulo de protocolos pedagógicos consta de un analizador de perfil, para

determinar, a partir de los datos almacenados en el módulo del estudiante, cuál será el
mejor protocolo pedagógico para utilizar en la siguiente sesión pedagógica.
El sistema cuenta con una base de protocolos pedagógicos donde su uso estará
subordinado a la disponibilidad de los contenidos en el módulo de conocimientos, pero
la lección siempre se puede generar para alguno de los protocolos, o de una manera
incompleta para los protocolos que requieran más recursos didácticos. Esto se puede
aclarar a través de un ejemplo: cuando el sistema determina que requiere presentar un
contenido del tipo magistral de un tema en particular, pero el módulo de conocimientos
no contiene la cantidad suficiente de elementos didácticos como para que la sesión se
pueda completar, el sistema puede decidir que el material es insuficiente y cambiar a
otro protocolo pedagógico. En el peor de los casos, se mostrarán solamente las
definiciones de los conceptos y las relaciones básicas entre ellos, utilizando un mapa
conceptual como lo define Novak [Novak, 1988] que es la información o discernimiento
mínimo que puede poseer el módulo de dominio de un tema en particular.
En el apartado siguiente, se analizará cómo el módulo del tutor puede realizar la

selección del protocolo pedagógico más adecuado y el objetivo de la sesión pedagógica
en particular para un estudiante usuario.

4.2.1.1 – Analizador de Perfil
El Analizador de Perfil debe encontrar el mejor protocolo pedagógico disponible en el

Sistema Tutor Inteligente (STI) que se adecue a las preferencias del estudiante para una
dada sesión pedagógica. La eficacia resultante en la elección de protocolo estará
influida por la precisión en el método de selección utilizado.
Para obtener datos acerca del modo en que cada alumno aprende, se utilizarán las
planillas de estilo de aprendizaje que son herramientas para la toma de datos. Se ha
determinado la validez18 y confiabilidad19 de este instrumento a través de su aplicación
por diversos investigadores desde la fecha de su creación [Felder, 1990; Figueroa,
2004]. Partiendo de los datos que proveen las planillas se determinará el protocolo
pedagógico de preferencia para cada estudiante en particular.
El objetivo de las planillas de estilos de aprendizaje es obtener datos acerca de la forma

en que el alumno aprende normalmente de un modo más natural. En el Estado del Arte,
sección 2.3.6.3 – Técnicas Educativas Generales, se analizaron los diferentes estilos de
aprendizaje.
Se seleccionó la planilla de estilos de aprendizaje de Felder [Felder, 1998; Figueroa et

al, 2004] entre las opciones disponibles, ya que la misma había sido utilizada con
buenos resultados en estudios acerca de los estilos de aprendizaje de los estudiantes de
Ingeniería Química e Ingeniería Informática. A su vez esta planilla es una herramienta
validada, que permite obtener información sólida para dar de sustento a una
metodología más abarcativa con vistas a la aplicación en el ámbito específico de la
Ingeniería Informática y de las Ingenierías en general. La planilla completa de estilos de
aprendizaje se puede ver en el Estado del Arte de esta tesis.
Luego de la administrar el cuestionario a los alumnos, con esos datos se propone utilizar
las herramientas que proporciona la Inteligencia Artificial (AI), tales como las Redes
Neuronales (NN) a fin de obtener la relación de las preferencias de los estudiantes con
los protocolos pedagógicos. A partir de una muestra significativa estadísticamente20 de
estudiantes de los cuales se tienen las planillas de estilos de aprendizaje completas, se
verá como los estilos de aprendizaje permiten el agrupamiento de acuerdo a las técnicas
de enseñanza o protocolos pedagógicos. Esto permitirá correlacionar la preferencia del
alumno con la disponibilidad del protocolo pedagógico más adecuado existente en el
sistema.
Como la selección del protocolo pedagógico es uno de los elementos a determinar se

desea agrupar los estudiantes en familias con características comunes, aunque
desconocidas de antemano. Esto se puede llevar a cabo utilizando las redes neuronales
del tipo Self Organizing Maps (S.O.M.) (también conocidas con el nombre de mapas de
18
Validez significa que la definición se ajusta al concepto y ésta debe referirse justamente a ese concepto
y no a algo similar, para asegurar que se está midiendo justamente lo que pretende y no otra cosa.
19
Confiabilidad se refiere a que si se repite la medición o el registro de información, el resultado será
siempre el mismo, independientemente del investigador.
20
Con un error de generalización menor al 3% para una población de 800 alumnos, el tamaño de la
muestra es de 120 sujetos, como se muestra en el apartado 5.2.1.

Kohonen) [Kohonen, 2001] que realizan una “clusterización” o agrupamiento según

determinadas características comunes del conjunto de individuos original.
Las redes S.O.M. utilizan aprendizaje no supervisado, donde las salidas de la red no
poseen un valor esperado durante la etapa de entrenamiento, por lo tanto los “clusters”21
resultantes al aplicar la red S.O.M. a los datos de entrada, si bien poseen características
en común, estas no pueden verse a simple vista. En la Figura 4.5 se puede ver activa
solamente el conjunto Mc que mejor se adapta al patrón de entrada x. Existen también
otros conjuntos Mi que se concuerdan aceptablemente con x, en la zona de Mc.
Figura 4.5: Conjunto

autoorganizado. Cuando se
ingresa un mensaje “x”, este se
envía a todos los conjuntos Mi del
MC modelo. De todos estos
conjuntos, solo Mc es el que
mejor concuerda con “x”. A su
x Mi vez, todos los modelos que se
encuentran en las cercanías de Mc
(marcados con el círculo grande)
tienen una buena concordancia
con el mensaje “x”. Cabe resaltar
que Mc difiere de un mensaje “x”
al siguiente. [Kohonen, 2001]
Una vez finalizado el proceso de formación del mapa topológico obteniendo los cluster
o familias con características comunes, se agrega a cada uno de los individuos
pertenecientes a la población original el identificador del grupo generado por la red
S.O.M. para continuar con el análisis. En la Figura 4.6 se puede ver el esquema general
de una red neuronal del tipo S.O.M., donde se establecen los pesos Wij para todas las
conexiones entre las neuronas de entrada y las de salida.
Las neuronas artificiales de

entradas representan todos
los parámetros del sistema.
En el caso particular de la
clasificación de las planillas
Entradas
de estilos cada una de las

neuronas de entrada
representara la respuesta
multiple-choice a cada una
de las preguntas del
cuestionario
W IJ
Dadas las entradas una
Salidas
única neurona se activará y

esta representará la
clasificación de la red.
Figura 4.6: Arquitectura típica de una red neuronal del tipo S.O.M.
21
Un cluster es una familia de datos o atributos que poseen características en común. Estas características
pueden ser explicitas o implícitas a los usuarios de los datos de la red.

Una vez obtenidos los agrupamientos resultantes de la red S.O.M. se utilizará un

algoritmo de inducción para hallar las reglas que caracterizan a cada uno de estos
grupos. En este caso se utilizarán algoritmos que pertenecen a la familia Top-Down
Induction Trees (TDIT) (o en castellano Árboles Inductivos de Arriba Hacia Abajo).
Si bien existen varios algoritmos que realizan estas funciones, uno de los mas completos
es el C4.5 de Quinlan [Quinlan, 1993], que es una extensión del algoritmo ID3
(Induction Decision Trees) propuesto también por Quinlan [Quinlan, 1986]. Su objetivo
es generar un árbol de decisión y luego las reglas de inferencia que caracterizan a dicho
árbol. En este caso particular, el C4.5 tomará como entradas los datos de los estudiantes
ya categorizados y como salida se obtendrán reglas del tipo:
Si Precondición1, Precondición2, …, Precondiciónn Entonces Clusterk .
Se utiliza el C4.5 en lugar del ID3 ya que el primero permite trabajar con valores
continuos para los atributos, separando los posibles resultados en dos ramas: una para
aquellos Ai≤q y otra para Ai>q, (donde Ai es un atributo y q es un valor limite para el
cual todos los elementos de la regla menores a q se abren en un subárbol de reglas y los
mayores en otro). El algoritmo genera un árbol de decisión a partir de los datos
mediante particiones realizadas recursivamente. El árbol se construye mediante la
estrategia de depth-first (profundidad primero) considerando todas las divisiones
posibles del conjunto de datos. Se selecciona, luego, la división del conjunto de datos
que resulta en la mayor ganancia de información. En el caso particular de que existan
atributos discretos, se considerará una división por cada uno de sus n resultados.
C4.5, construye reglas que abarcan todos los datos, cubriendo todos los ejemplos
positivos y ninguno de los negativos. En el caso de existir un ejemplo negativo a una de
las reglas, se continúa avanzando en profundidad en el árbol de atributos. Además, el
algoritmo puede aceptar entradas incompletas que soluciona mediante pre o post
procesamiento, donde se reduce la cantidad de reglas generadas mediante pruning22
(truncamiento o poda), sin afectar la precisión de las reglas obtenidas. El resultado será
un conjunto de reglas que describen a cada uno de los clusters, pudiendo identificar las
características de cada una de las familias de elementos encontradas. En la Figura 4.7 se
puede ver un resultado gráfico posible como salida del algoritmo de inducción C4.5.
Para clasificar a un individuo dentro de los grupos establecidos se debe partir del nodo
denominado Root y se debe evaluar cada uno de los atributos hasta llegar a un nodo
terminal que contiene la clasificación final.
22
En el caso particular del algoritmo C4.5, el mecanismo de pruning funciona de la siguiente manera: una
vez creado el árbol de decisión sobre un conjunto de instancias de entrenamiento, se realizan ajustes al
árbol y se evalúa esta versión modificada contra un conjunto de instancias de validación. El algoritmo
solo mantiene los cambios si el árbol modificado o podado (pruned) se comporta de manera superior al
original. El uso de un conjunto de instancias de validación ayuda a eliminar el overfitting en la
información por medio de la evaluación de las inconsistencias y las coincidencias de este conjunto contra
el conjunto de instancias de entrenamiento. El error se reduce podando los nodos internos del árbol,
reetiquetándolos con la nueva clasificación y descartando todos sus nodos descendientes. Esto
obviamente limita el overfitting, pero es un proceso de costo computacional elevado.

Root
Nodo 0
Edad Edad
< 21 ³ 21
Nodo 1 Nodo 2
3
S: 35%
C: 100%
Sexo Sexo
Masc Fem
Nodo 3 Nodo 4
Carrera Carrera Carrera Carrera

0 1 5 Otras
Nodo 5 Nodo 6 Nodo 7 Nodo 8
3 3 2 3 3
S: 50% S: 06% S: 5% S: 08% S: 0%
C: 95% C: 80% C: 100% C: 83% C: 100%
Figura 4.7: Árbol de decisión generado por el algoritmo C4.5 a partir de la clasificación obtenida
mediante la aplicación de redes S.O.M., donde S representa el soporte y C es la confianza de la regla.
Una vez obtenida la menor cantidad posible de reglas por medio de pruning (poda) para
evitar el overfitting23 (sobre ajuste), se esta en condiciones de pasar a otra etapa del
análisis en la que, por medio de un proceso de inferencia, se relaciona las reglas
descriptivas de los distintos clusters con los protocolos pedagógicos disponibles. Para
llevar a cabo la inferencia se cuenta con datos adicionales del desempeño de los mismos
estudiantes en los cursos en estudio con diferentes protocolos de enseñanza. En la
Figura 4.8 se puede ver el esquema que representa al proceso de selección en forma
global, donde se parte de una población de estudiantes de los cuales se posee sus
preferencias con respecto a los estilos de aprendizaje a través de las planillas, se los
agrupa usando S.O.M. Se arma una tabla de estudiantes clasificados, donde para todos
los atributos que describen a la planilla se le asigna un cluster Cj predicho por S.O.M. y
el algoritmo C4.5 se encarga de generar las reglas de describen a los clusters,
relacionando el cluster Cj no con todos los atributos, como en la tabla de estudiantes
clasificados, sino con un conjunto de reglas del estilo Si Pre1 y Pre2 y … Prem entonces
Cj.
Una vez identificadas las reglas que describen a cada uno de los clusters generados
como salida de S.O.M., se realiza una inferencia, planteando una serie de hipótesis, para
poder relacionar la relación entre los protocolos pedagógicos con los estilos de
aprendizaje relevados y agregar esta característica dentro del submódulo
correspondiente de un STI.
23
En el caso en que los datos relevados sean demasiado homogéneos (una varianza muy pequeña) el
algoritmo de inducción podría encontrar un modelo demasiado optimista, que satisface demasiado la
tendencia de los datos tomados, pero que a la vez es pobre para hacer predicciones para los datos que
tiene una varianza grande, los cuales pueden ser los más representativos del dominio.

Estudiantes Clusters Estudiantes Clasificados

C1
1 1 1
Atr 1 , Atr 2 , …, Atr n Ci
S.O.M.
N.N. 2 2 2
Atr 1 , Atr 2 , …, Atr n Cj
… …
n n n
Cn Atr 1 , Atr 2 , …, Atr n Ck
C2
Inducción
Submodulo 1 1 1
Si Pre 1 , Pre 2 , …, Pre n Entonces Ci
Reglas de los
Pedagógico
Clusters
Inferencia 2 2 2
Si Pre 1 , Pre 2 , …, Pre n Entonces Cj
Protocolos … …
Pedagógicos n n n
Si Pre 1 , Pre 2 , …, Pre n Entonces Ck
Figura 4.8: Esquema básico para la inferencia de los distintos patrones para categorizar los estilos
pedagógicos de los alumnos.
4.2.1.2 – Inferencia del Protocolo Pedagógico
En esta etapa se busca relacionar los agrupamientos generados por S.O.M. con los
protocolos pedagógicos entrenando una red neuronal del tipo Backpropagation.
Para hallar la relación entre el estilo de aprendizaje y el protocolo pedagógico que

corresponde a cada grupo se tomaran los protocolos básicos que describe Perkins
[Perkins, 1995] en la Teoría Uno:
· La instrucción didáctica o Magistral: Satisface una necesidad que surge en el

marco de la instrucción: la de expandir el repertorio de conocimientos del
alumnado.
· El entrenamiento: Satisface la necesidad de asegurar una práctica efectiva.
· La enseñanza socrática: El docente ayuda al alumno a comprender ciertos

conceptos por sí mismo y darle la oportunidad de investigar y de aprender cómo
hacerlo.
Por lo tanto la investigación se orienta en la búsqueda de la relación entre la

predilección de los alumnos de aprender de manera más eficiente y los protocolos
pedagógicos utilizados por los tutores humanos (profesores); Para ello, como
parámetro orientador se usarán las notas de las evaluaciones parciales para establecer
dicha relación.
Para realizar la inferencia y relacionar los clusters obtenidos por medio de las redes
neuronales S.O.M. con los protocolo pedagógicos (ver sección 2.3.3.4.1 – Modelos
Enseñanza y Aprendizaje) se tomarán dos cursos (A y B) en los que se dictan materias
pertenecientes al área de Programación Básica. El único cambio fundamental entre
ambos se centró en la forma de enseñanza del docente, es decir, en el protocolo
pedagógico utilizado para dictar las clases.

Desde este marco de referencia, se evalúan dos cursos según el control de variables
planteado por García en el libro El Paradigma del Pensamiento del Profesor [García,
1995]. Las variables planteadas para los cursos de referencia son las siguientes24:
· Contenidos de la materia similares.
· Horarios Similares (dentro de un turno, como puede ser mañana, tarde, noche).
· Bibliografía utilizada como referencias similares.
· Ingreso aleatorio de los estudiantes, sin preferencia definida por algún curso.
· Cantidad y formación similar en los ayudantes y Jefes de trabajos prácticos.
· Herramientas didácticas similares (como el uso de cañón y foros de discusión).
· Modo en el dictado de la clase, donde cada uno de los docentes presenta las
clases en función del protocolo pedagógico que le resulta más natural de llevar a
cabo entre las opciones posibles que se definen en la Teoría Uno y que se
analizan en esta investigación, independientemente de las necesidades o
preferencias de los estudiantes individualizados.
A partir del análisis de García, se observa para este estudio que la única que cambia es
la denominada “Modo de dictado de clase”, es decir, el protocolo pedagógico para cada
curso.
Se tomarán como base para realizar la inferencia los datos correspondientes a las
calificaciones en los primeros parciales, o las primeras oportunidades de evaluación
(que pueden incluir eventualmente los exámenes recuperatorios), ya que es el único
estado del que se poseen datos completos y donde el estudiante es precisamente un
novato en el tema.
En la etapa del final del curso, el estudiante ya ha puesto a prueba sus conocimientos
durante el examen parcial y conoce, por lo menos, la mecánica de algunos ejercicios y
la estructura general de las evaluaciones.
Para llevar a cabo la inferencia, se planteará la siguiente hipótesis: Es posible relacionar

los estilos de aprendizaje con los protocolos pedagógicos. De esta se desprenden dos
hipótesis más particulares:
24
Se ha observado que en el aprendizaje, no solo impactan las variables antes mencionadas, sino que
también en el marco global de una clase para un grupo de personas, con uno o varios tutores humanos,
sólo puede explicarse utilizando un protocolo pedagógico que debido al número de tutores limitados,
no pueden individualizarse las necesidades de cada uno de los estudiantes, como casos particulares.
Esta limitación no la poseen los Sistemas Tutores Inteligentes (STI), sino que por el contrario, éstos
planean las sesiones en forma independiente para cada uno de los estudiantes usuarios, con objetivos
definidos en función de las necesidades instantáneas de los mismos.

1. La composición de estilos de aprendizaje (necesidades y preferencias de los

estudiantes) de cada estudiante determina el estilo de enseñanza (o protocolo
pedagógico) más adecuado.
2. Aquellos estudiantes en los que el estilo de enseñanza no coincide con su

preferencia, presentan dificultades en la aprobación de la asignatura.
A partir de la segunda hipótesis se desprende que para los alumnos aprobados, el

protocolo mayoritario preferido por los estudiantes deberá ser el que coincida con el
utilizado en clase, mientras que para los reprobados, el protocolo mayoritario deberá
encontrarse invertido25.
Para validar esta afirmación se entrenó una red del tipo Backpropagation con las
siguientes características:
o Se seleccionaron los aprobados del curso con profesor que dicta en estilo
socrático más la mayoría de los reprobados del curso con profesor que dicta en
modo magistral y se entrenó la red considerando la salida como protocolo
socrático.
o Se seleccionaron los aprobados del curso con profesor que dicta en estilo
magistral más los reprobados del curso con profesor que dicta en modo socrático
y se entrenó la red considerando la salida como protocolo magistral.
Para realizar el entrenamiento de esta manera se debe suprimir el “ruido” que aportan
los grupos que quedan fuera del análisis (los que aprobaron con cualquier protocolo,
que se denominarán indiferentes y los que reprobaron por falta de estudio u otras
razones) y se espera que el error de la herramienta sea menor que el porcentaje de
elementos que quedan fuera del análisis. Por lo tanto, para cada cluster generado se
analizará:
Con protocolo Correcto à Es mayoritario

o Estudiantes Aprobados
Indiferentes y mal clasificados à Es minoritario
Con protocolo Invertido à Es mayoritario

o Estudiantes Reprobados
Falta de estudio y otras causas à Es minoritario
En este punto la problemática se reduce a la Figura 4.9.a donde el profesor, divide al

universo de estudiantes en dos conjuntos disjuntos: los aprobados y los reprobados
basándose en su rendimiento académico, mientras que la red S.O.M. divide al universo
de estudiantes en dos conjuntos disjuntos, el cluster 1 y cluster 2 (Figura 4.9.b),
basándose en el estilo de aprendizaje.
25
Si un alumno pertenece al protocolo mayoritario (predicho por S.O.M) de los reprobados, es por que su
preferencia de protocolo pedagógico no coincide con el del curso en el que esta inscripto y debería
haberse anotado en otro.

Estudiantes de un Curso (A o B) Clústers Generados (1 o 2)

Profesor (con
un determinado
Planillas de
protocolo Aprobados Clúster
Estilos de
pedagógico 1
aprendizaje
Universo de asociado) Universo de
Estudiantes Estudiantes
Red Neuronal
S.O.M.
Reprobados Clúster
2

Figura 4.9: Se ven los dos procesos: por un lado al estudiante siendo evaluado por el docente (4.9.a) y
por el otro a las redes S.O.M. clasificando el universo de estudiantes en distintos clusters (4.9.b).
Ahora se busca relacionar las formas de enseñanza y los estilos de aprendizaje, tomando
como base para el análisis a los estudiantes reprobados. En la Figura 4.10 se observa,
tomando como base un ejemplo en donde solo existen dos protocolos pedagógicos y dos
preferencias en el conjunto de estudiantes, que los estudiantes cuya preferencia coincide
con la forma o estilo de enseñanza no tienen problemas para aprobar. Existen dos
subconjuntos (en rojo) de estudiantes cuya preferencia no coincide con la forma de
enseñanza y son los que reprueban, ya que se encuentran “mal ubicados”.
Protocolo de preferencia
del Estudiante Problemática:
Magistral Socrático
Se analizan los estudiantes
desaprobados que prefieren
Magistral Reprobados. el protocolo pedagógico
invertido al utilizado al recibir
Tutor
las clases. Estos son los

que, según las hipótesis,
Socrático Reprobados. están mal clasificados.
Figura 4.10: Esquema general de la inferencia, para relacionar los clusters con los protocolos
pedagógicos.
Siendo la hipótesis: Los alumnos reprobados que no pertenecen al cluster mayoritario

predicho por S.O.M. deben tener la preferencia de un protocolo pedagógico diferente
(invertido en este caso) al del profesor con que cursaron la materia.
Requieren de
Reprobados de un Curso Diferente
Curso (A o B)
Los alumnos reprobados que no pertenecen al cluster

Reprobados mayoritario predicho por S.O.M. deben tener la preferencia Cambio a un curso
con protocolo de un protocolo pedagógico diferente (invertido en este más acorde a las
invertido caso) al del profesor con que cursaron la materia. preferencias del
estudiante
Figura 4.11: Procedimiento para llevar a cabo la inferencia a fin de detectar a los estudiantes que no
coinciden con el protocolo pedagógico de su preferencia.

Por otra parte, en la Figura 4.11 se muestra la idea de la hipótesis, donde los alumnos
reprobados, que no pertenecen al cluster mayoritario, deben tener una preferencia de
protocolo pedagógico diferente al protocolo pedagógico recibido en las clases.
Existen además dos casos que no se encuadran en las ideas precedentes y que son:
· Los estudiantes aprobados: Que no han recibido lecciones utilizando el protocolo

pedagógico de su preferencia y los que si lo han hecho, que puede denominarse
indiferentes al protocolo. Estos casos caen fuera del análisis, ya que es posible
obtener resultados satisfactorios recibiendo lecciones con protocolos pedagógicos
diferentes al de preferencia del estudiante. En este sentido Perkins [1995] sólo
señala que la tendencia a fallar es mayor cuando el estudiante no recibe lecciones
con el protocolo de su preferencia, pero no hace referencia alguna a los estudiantes
que superan los exámenes con un protocolo diferente. Estos estudiantes quedan
fuera del análisis ya que el objetivo de esta tesis es la de proponer una solución al
alto número de alumnos reprobados en las materias de Programación Básica.
· Los estudiantes reprobados: Que han recibido lecciones utilizando el protocolo

pedagógico de su preferencia: éstos casos se pueden deber a diversos motivos, como
falta de estudio, falencias en la forma de estudiar (falta de una metodología de
estudio), etc, que no modifican la inferencia realizada en este caso.
Por lo tanto, si se analizan los datos provistos por los docentes de ambos cursos con
respecto a las categorizaciones realizadas por el sistema S.O.M., se puede obtener cuál
es el porcentaje de alumnos que estarían mal ubicados en los cursos, y que se
evidencian a través de los resultados reprobados obtenidos en las evaluaciones.
Para que el resultado obtenido sea satisfactorio, la red neuronal Backpropagation deberá
tener un error de clasificación menor al porcentaje de elementos que quedaron fuera del
análisis, de esta manera esta herramienta será útil para la clasificación de las
preferencias de enseñanza (protocolo pedagógico) de los estudiantes a partir de sus
estilos de aprendizaje.
De este modo, no solo el submódulo analizador de perfil entrega el mejor protocolo

pedagógico, sino que debería dar una escala o ranking de estos protocolos en orden
descendente con respecto de su preferencia para el estudiante seleccionado. Luego, lo
único que se requiere es recorrer todos los protocolos pedagógicos incluidos en el
sistema, en el orden que se indica en este ranking y comprobar que el material necesario
para llevar a cabo la lección utilizando ese protocolo en particular esté disponible en el
módulo del dominio. Es necesario evaluar las opciones alternativas de protocolos
pedagógicos ya que el módulo del dominio puede no contener almacenados los datos
suficientes para completar satisfactoriamente una sesión pedagógica en todos los
protocolos que se encuentran en el sistema.
Dado que las redes Backpropagation son redes neuronales artificiales multicapa, con n
capas ocultas y con conexiones hacia delante y no auto recurrentes [Werbos, 1990] se
deben establecer los parámetros para el funcionamiento óptimo (cantidad de neuronas
en las capas ocultas, cantidad de neuronas de entrada y salida, parámetros de
aprendizaje, etc.).

El esquema básico de la solución modificada que se ve en la Figura 4.12, donde la red

del tipo Backpropagation proporciona un ranking de aptitud de los protocolos
pedagógicos disponibles en el sistema, mientras que el esquema general de la solución
original, donde la red S.O.M. entrenada o el árbol de decisión son los que proveen de la
salida básica como seleccionadores de protocolo pedagógico se observa en la Figura
4.13.
Red Backpropagation Módulo del

Dominio
E1 Listado de
semejanza Conceptos
N1 porcentual
E2 Ns entre los datos
de entrada del
N2 estudiante y el Se verifica
E3 protocolo de que el
Ns salida. módulo del
Nn dominio
En posee los
datos
necesarios.
Modulo del Estudiante Planificador de Lección
Se evalúan los conceptos disponibles

y los necesarios para cada uno de los
protocolos pedagógicos resultantes.
Características del Se analiza el primero, si no alcanzan
Estudiante los recursos se pasa al segundo y asi
sucesivamente.
Figura 4.12: Estructura modificada de la solución, utilizando la red neuronal Backpropagation que
genera una lista de los protocolasen orden de preferencia.
Árbol de Decisión Módulo del S.O.M Entrenada Módulo del

Dominio Dominio
A
Conceptos E1 Conceptos
B C N1
D E E2 Ns
Protocolo Nn Protocolo
F G H Pedagógico En Pedagógico
(E) (E)
Al Planificador de
Al Planificador de
Módulo del Módulo del

Estudiante Estudiante
Lección
Lección
Características del Características del

Estudiante Estudiante

Figura 4.13: Se observa la estructura de la solución en sus dos versiones, una utilizando directamente
las reglas resultantes, modificando las salidas para que concuerden con los protocolos pedagógicos
(4.13.a) y otra donde se utiliza la red neuronal artificial S.O.M. ya entrenada para establecer el
protocolo pedagógico a utilizar (4.13.b).

4.2.1.3 – Submódulo de Generador de la Lección.
Una vez seleccionado el protocolo pedagógico por el submódulo Analizador de Perfil,

se deben generar los contenidos de la sesión a ser presentados al alumno usuario del
sistema. Además el trabajo del Generador de la Lección es el de manejar la interacción
entre el sistema y el alumno usuario.
Luego de la selección del protocolo pedagógico, el paso que sigue es encontrar cuál es
el concepto a explicar en la lección, esto se realiza comparando el mapa de
conocimientos que se obtiene del módulo del dominio y los conocimientos que el
sistema supone que el estudiante posee que se obtiene del módulo del estudiante.
Se deben “superponer” los conocimientos del estudiante sobre el mapa de conocimiento

que se obtiene del módulo de dominio para encontrar los conocimientos faltantes, y de
acuerdo al tiempo disponible o una función que destaque la importancia parcial de cada
uno de los temas, se agregaran al stack de objetivos de la lección.
El Generador de contenidos debe ahora encargarse de presentar los contenidos en orden

y procesar las respuestas de los estudiantes, agregando conceptos mal clasificados del
alumno por el sistema en el stack de objetivos de la lección e informando de esta
discrepancia entre la realidad y lo supuesto por el sistema el módulo del estudiante.
Cuando el sistema detecta que el estudiante ha adquirido un nuevo concepto, o que se ha

corregido un concepto erróneo, es el generador de contenidos el encargado el encargado
de actualizar el estado del stack de objetivos y si este se encontrase vacío, dará por
finalizada la sesión tutelar.
Interfaz Módulo Dominio Módulo estudiante
A A
B C B C
Submódulo de Lenguaje Natural
D E E
F G H
Generador de
Contenidos Stack de
Objetivos
impartir en la sesión
Los conceptos
Conocimientos a
D que aparecen A
punteados son la
pedagógica
Protocolo
Pedagógico “n” diferencia entre B C
los conocimientos
a impartir y los D E
conocimientos
actuales del
estudiante F G H
Submódulo Analizador de Perfil usuario
Figura 4.14: Esquema general de los pasos a seguir luego de la obtención del protocolo pedagógico por el
submódulo analizador de perfil y de la creación de los contenidos de la lección.

Una vez que las salidas son procesadas por el generador del lenguaje natural, estas se
envían directamente a la interface del sistema. Cuando el estudiante responde las
preguntas del sistema, es decir, continúa la interacción planteada por el sistema, todos
los datos son pasador desde la interface del sistema al módulo de lenguaje natural y de
este, parte la información procesada para convertirse en la entrada del generador de la
lección, el cual la evaluara y provocara las respuestas pertinentes. El esquema general
del funcionamiento del generador de la lección puede verse en la Figura 4.14 donde
gestiona sobre el módulo del estudiante los conocimientos del alumno y sobre el
módulo del dominio los conocimientos a explicar, los superpone y detecta los
conocimientos faltantes en la estructura del estudiante y seleccionando uno y utilizando
el protocolo pedagógico resultante del submódulo analizador de perfil se pasa a generar
los contenidos necesarios.
Este módulo es el responsable de controlar la interacción entre el tutor y el estudiante,

por lo tanto debe decidir cómo responder ante el estudiante dado un problema en
particular [Woolf, 1984]. La lección debe ser planeada especialmente y debe ser lo
suficientemente flexible y coherente como para respetar la interacción. El ítem de la
flexibilidad es central en el planeamiento de la lección, ya que en tutores mas antiguos,
como el tutor Meno [Woolf, 1984], el STI era capaz de seleccionar discursos
almacenados con anterioridad, pero la falta de control global sobre la lección no
permitían flexibilidad con respecto a las interacciones del alumno (el grado de la
flexibilidad de la interacción está dada por el tamaño de los discursos almacenados:
cuanto más largo el discurso almacenado, menor el grado de flexibilidad de la
interacción).
Por lo tanto se pueden redefinir las funciones básicas del módulo generador de
contenidos cómo decidir la forma de presentar al estudiante la información, el orden en
la que esta información se presentará y cómo se responderá a las interacciones del
estudiante usuario. Se pueden plantear los objetivos principales de este módulo como
las mencionadas por Woo Woo [Woo Woo, 1991]:
· Decidir cuando presentar los contenidos de la lección, interactuando con los

otros módulos del sistema tutor inteligente en general y con los submódulos del
módulo tutor en particular, como el generador de lenguaje natural, el evaluador,
los protocolos pedagógicos, etc.
· Corregir los conceptos erróneos del estudiante para un problema dado y generar
el feedback en todas las respuestas del usuario hacia el sistema durante la sesión
pedagógica.
· Si el estudiante usuario no logra dar con la respuesta correcta, el tutor debe

proveer los medios para que el estudiante se encauce nuevamente en el camino
correcto para solucionar el problema. Es aquí donde se insertaran los conceptos
de pistas que aporta Hume [Hume, 1995; Hume, 1996]. Es en este paso donde
esta función difiere levemente con lo planteado por Woo Woo, ya que se
utilizara el stack de objetivos para conocer el estado de la lección.
· La forma en la que el discurso de la sesión se encuentra en el sistema, debe estar

en forma explicita, en lugar de almacenado en forma procedural como en el tutor
Meno [Woolf, 1984]. Esto debe permitir modificar las estrategias de enseñanza a

medida que la lección progresa en el tiempo. Se pueden utilizar las técnicas de

“guiones” para codificar las acciones posibles en el discurso dentro de cada uno
de los temas o unidades didácticas. Así se pueden generar los contenidos de una
manera sencilla y lo suficientemente flexible como para obtener un mayor
rendimiento de una interacción entre el sistema y el estudiante usuario.
· El sistema debe responder las preguntas del usuario con la respuesta mas
apropiada dentro de todas sus opciones (Solo se están evaluando las
interacciones que son iniciadas por el sistema y no por el estudiante).
A continuación se detallará la forma de establecer los objetivos de la lección pedagógica

(estrategia) y luego se detallarán qué tácticas implementan estas estrategias.
4.2.1.4 – Determinación de Objetivos de la Lección.
La determinación de los objetivos de la lección es una tarea esencial a llevar a cabo por
los Sistemas Tutores Inteligentes, ya que debe generar objetivos globales, coherentes y
consistentes para que estos sean impartidos a cada estudiante en particular. [Woo Woo,
1991]. Dado que cada uno de los conceptos almacenados en el módulo del dominio para
cada asignatura están relacionados entre sí, la secuencia en la que éstos se presenten
afectará de manera decisiva la performance del sistema en su conjunto y las necesidades
del estudiante. La determinación de los objetivos dejará planteada la estrategia del
sistema para una sesión pedagógica en particular.
Woo Woo [Woo Woo, 1991] plantea la determinación de objetivos utilizando como
base una “tabla de predicción” que almacena los resultados en el módulo del estudiante.
Estas ideas son implementadas en el tutor CircSim [Kim, 1989; Kim, 2000; Cho, 2000;
Hume, 1995; Shah, 1997; Hume et al., 1992] y pueden generar un planeamiento tanto
de tipo dinámico como de tipo jerárquico. El problema del CircSim es el mismo que se
resalta en la sección 2.3.5.1 – El Proyecto CircSim, que al ser un Sistema Tutor
Inteligente aplicado al dominio de la medicina, mas precisamente a las afecciones del
sistema circulatorio, posee módulos superpuestos.
Por lo tanto, la determinación de los objetivos de la lección no solo requiere el uso de

conocimientos almacenados en el módulo del estudiante, para determinar lo que éste
conoce y lo que desconoce, sino que también requiere metainformación sobre los
conceptos a impartir. La metainformación es información adicional acerca del
conocimiento y se utiliza en el caso del módulo del dominio para determinar las
dependencias entre los distintos conceptos, el tiempo que puede tardarse en impartirlos
y la importancia de los mismos (si son un concepto aislado, si son subtemas o si son
temas principales o capítulos). Con la metainformación se puede armar el mapa de
conocimientos del alumno como el conjunto básico de conocimientos necesarios para
finalizar con la curricula de la asignatura.
Por otra parte no es el objetivo de una lección pedagógica obtener las dependencias del
módulo del dominio e impartirlas todas en una única “mega” sesión pedagógica, sino
que la idea de la flexibilidad de un Sistema Tutor Inteligente también reside en que este
sea capaz de evaluar los conocimientos adquiridos por el estudiante y actuar conforma e
ello. Es por esto que se requiere contrastar los datos del módulo del dominio con el

mapa de conocimientos instantáneo del estudiante que se obtiene en el módulo del

estudiante para encontrar cuales son los conceptos posibles y disponibles para impartirle
al estudiante. Un esquema del procedimiento a seguir puede verse en la Figura 1.15.
Módulo Dominio Módulo Estudiante
Una vez finalizada la sesión

MA A A y cumplidos los objetivos se
realiza el feedback hacia el
módulo del estudiante para
MB B MC C B C actualizar el mapa de
conocimientos del
estudiante.
MD D ME E MF F E F
Objetivos de la Sesión Pedagógica (Estrategias)

Protocolo Se imparte la sesión con
pedagógico Metainformación D Concepto D. el protocolo pedagógico
seleccionado + ¦ (F) seleccionado, logrando
para la sesión Metainformación F Concepto F los objetivos
preestablecidos.
Metainformación D+F Concepto D + Concepto F
Figura 4.15: Esquema general para la selección de objetivos para la sesión pedagógica y
retroalimentación luego de finalizar dicha sesión.
Una vez que se determinan todas las combinaciones válidas entre los conocimientos
faltantes en el mapa de conocimientos del estudiante y los conceptos almacenados en el
módulo de dominio debe existir una función para determinar cuál de todas las
combinaciones será la seleccionada para la sesión en particular. Se debe tener en cuenta
que el número de opciones puede ser relativamente grande y éstas requieren un análisis
mas complejo, el cual no es el objetivo de esta tesis explicar.
Existen distintas opciones para implementar la función que determinará cual de todas
las opciones será la seleccionada para una determinada sesión pedagógica. Por ejemplo,
en el tutor CircSim [Kim, 1989; Kim, 2000; Cho, 2000; Hume, 1995; Shah, 1997; Hume
et al., 1992] se selecciona el objetivo de la sesión por medio de un conjunto de reglas
que toman como base los conocimientos del estudiante [Woo Woo, 1991], estas reglas
son tomadas de sesiones de educción de conocimiento con tutores humanos, pero fallan
nuevamente en la separación de los módulos, ya que los conocimientos resultantes a
enseñar deben provenir del módulo de dominio y no estar escritos en forma “Hard-
Coded” dentro del módulo del estudiante. Otra opción es, por ejemplo, la que se utiliza
en el tutor Meno [Woolf, 1984] donde se va avanzando linealmente por cada uno de los
temas de la curricula.
Independientemente el método que se utilice para la creación de la función para

determinar el objetivo de la lección, los parámetros sobre los que se puede realizar la
evaluación están relacionados con los metaconocimientos que almacenan los conceptos
en el módulo del dominio. Por ejemplo, se pueden citar los siguientes criterios como
evaluación de cada una de las opciones: duración, profundidad, relación con la curricula
docente, etcétera.

4.2.1.5 – Arquitectura del planeador de la Lección.
Este submódulo interactúa con varios componentes del Sistema Tutor Inteligente para
ejercer el control entre la interacción entre las preguntas y respuestas entre el sistema y
el estudiante. Cuando se procesan las respuestas a una serie de preguntas realizadas por
el sistema, el planeador de la lección debe decidir qué acción tomar a continuación,
siguiendo las pautas básicas del protocolo pedagógico seleccionado, por lo tanto el
planeador requiere conocimientos en cada punto de la lección para poder comunicarse
con el usuario, esto se logra a través de reglas o “guiones”, las cuales se obtienen de los
expertos por las técnicas de educción de conocimientos. Este proceso formal se lleva a
cabo utilizando la metodología para generar sistemas expertos.
Por otro lado se requiere mantener el estado de la interacción entre el sistema y el

estudiante usuario, para ello se mantiene el stack de objetivos, donde se almacenan, en
la forma de estructura del tipo LIFO26. El generador de contenidos se encargará de
conocer el contexto de las respuestas del estudiante con respecto al valor tope del stack
de objetivos (o a los primeros n valores del stack).
26
LIFO es el acrónimo en ingles de Last In – First Out, o en castellano el último en entrar es el primero
en salir. Es la metodología básica para la operación de una estructura del tipo pila.

5.1 – Introducción
En este capítulo se describe cómo fueron obtenidos los datos y cuáles fueron los
procesos realizados a fin de generar las reglas de decisión para seleccionar el protocolo
pedagógico en el submódulo correspondiente en un Sistema Tutor Inteligente (STI).
Los resultados experimentales permitirán validar la solución propuesta y quedarán

establecidos los pasos para poder repetir las experiencias con otro grupo de estudiantes
o aplicar el método en otros dominios diferentes al de la Programación Básica..
Los pasos fundamentales para el diseño experimental se describen en la Tabla 5.1

donde se comienza con la toma de datos de los estudiantes (a planillas de estilos de
aprendizaje) y se las utiliza como entrada para el entrenamiento de una red neuronal
artificial S.O.M. para generar los diferentes agrupamientos. Luego se buscan las reglas
que describen estos agrupamientos por medio del algoritmo C4.5
A su vez, partiendo de los datos de rendimiento académico se analizan los estudiantes

aprobados y se los relaciona con los reprobados, para proceder luego a entrenar una red
del tipo Backpropagation para establecer la relación entre el estilo de aprendizaje y el
método de enseñanza.
Paso Entrada Acción Salida

Resultado de las planillas de estilos
Toma de datos de Administración de Planillas de
1 de aprendizaje
alumnos de la materia estilos de aprendizaje
Agrupamientos con cardinalidad
Datos de planillas de Entrenamiento red Neuronal consistente con la cantidad de
2
estilos de aprendizaje S.O.M. protocolos pedagógicos propuestos
en la teoría uno.
Agrupamientos + Encontrar las reglas que
Datos de planillas de gobiernan los clusters generados Reglas de cada cluster generado y
3
estilos de aprendizaje. por S.O.M. utilizando el su árbol correspondiente.
algoritmo inductivo C4.5
Datos de rendimiento
académico de Registro en Planillas de
4 Evaluaciones parciales
alumnos de la calificaciones
materia
Datos de Planillas de
Análisis de los clusters y
estilos de aprendizaje Lista de alumnos desaprobados por
5 determinación del cluster de los
+ calificaciones + cluster
Reprobados
Clusters
Entrenamiento red Neuronal Determinación del error de las
Backpropagation con: observaciones que quedaron fuera
del análisis.
Datos de Planilla de
6 Mayoría Aprobados Magistral +Mayoría
estilos de aprendizaje
desaprobados socrático = Magistral Establecimiento de la relación entre
Mayoría Aprobados Socrático +Mayoría estilo de enseñanza y estilo de
desaprobados Magistral= Socrático
aprendizaje.
Tabla 5.1: Etapas fundamentales del diseño experimental, que se llevarán cabo a lo largo de este capitulo.
RESULTADOS EXPERIMENTALES Fernando A. Salgueiro 115

5.2 –Instrumento de Toma de Datos Aplicado al Dominio
Se parte de la planilla de estilos de aprendizaje descrita en la sección 1.6.1 –

Instrumento para la toma de datos y se la aplica a una muestra de individuos en estudio
pertenecientes al área de la Programación Básica. Se recaba la información y se
requieren verificar los siguientes aspectos:
1. Calculo del tamaño muestral: Se debe analizar la cantidad de muestras de la

planilla de estilos de aprendizaje a obtener para el análisis.
2. Error de Generalización: Se debe calcular cuál es la cota del error de

generalización al tomar solo una fracción representativa del total de individuos y
como impacta ese error en el resto del análisis.
3. Codificación de los resultados: Para ser utilizados en los pasos sucesivos de la

solución propuesta, los datos relevados deben ser codificados. Por lo tanto se
deberá proponer una codificación eficiente que sea compatible con las
herramientas que se le aplicarán a los datos obtenidos.
5.2.1 –Cálculo del Tamaño Muestral
La muestra utilizada corresponde a 121 estudiantes de las materias de Programación

Básica de la Facultad de Ingeniería de la Universidad de Buenos Aires,
correspondientes al primer cuatrimestre del año 2004 (74 pertenecen a Computación y
47 a Algoritmos y Programación I).
La muestra incluye las carreras que se dictan en dicha Facultad a excepción de

Ingeniería Electrónica, por el motivo ya explicado. Además la cantidad de alumnos que
cursan esas materias para el primer cuatrimestre del 2005 asciende a 80027, en la Tabla
5.2 se puede ver la disponibilidad de cursos para ambas materias según datos obtenidos
de los cursos y cupos disponibles del sistema de inscripción de la Facultad
(http://intra.fi.uba.ar/insc/consultas/cursos.html).
Materia Cátedras Vacantes

Computación (75.01) 9 390
Algoritmos y programación I(75.01) 7 410
Totales 16 800
Tabla 5.2: Cupos disponibles para las de Programación Básica para el primer cuatrimestre del 2005
Por lo tanto, el tamaño de la muestra corresponde con el 15% de ambas materias (el
20% de los alumnos de la materia Computación y el 11% de los alumnos de la materia
Algoritmos y Programación I).
27
Se tiene en cuenta la capacidad máxima de los distintos cursos, mientras que la matricula real puede
encontrarse por debajo de este numero y los errores obtenidos pueden ser menores. Se toma este
número como una cota superior máxima para todos los errores.
116 Fernando A. Salgueiro RESULTADOS EXPERIMENTALES

Para determinar el tamaño muestral mínimo se trabajó con el desarrollo que presenta
Hernández Sampieri [Hernández Sampieri, 2001] para el cálculo de la muestra. Se tiene
una población inicial de 800 estudiantes donde S2 es la varianza de la muestra n que
puede determinarse en términos de la probabilidad p donde:
V=0.03 (5.1)
V2= (0.03) 2=0.0009 (5.2)
Por lo que el tamaño de la muestra sin ajustar a la población es:
n= (S2 /σ2)= 0.09/0.0009= 100 Estudiantes. (5.3)
Corrigiendo en función de la población N se tendrá el tamaño ajustado de la muestra:
n = (n´/(1+n´/N))=100/(1+100/800) = 89 Estudiantes. (5.4)
El error de generalización está por debajo del 3% (tanto la muestra ajustada como la no
ajustada), con lo que se puede decir que el tamaño de la muestra es representativa para
todos los alumnos de las materias Computación y Algoritmos y Programación I.
El error para la generalización de los resultados es suficiente bajo como para utilizarlos
como entrada para el entrenamiento y posterior clusterización por medio de una red
tipo S.O.M.
De esta manera la cantidad de planillas obtenidas permite el análisis de los resultados,

teniendo en consideración que los datos representan adecuadamente a la población en
estudio.
5.2.2 –Codificación de los Datos Relevados.
Una vez relevados los datos utilizando las planillas, éstos fueron codificados para
realizar el entrenamiento de las redes neuronales S.O.M para agrupar estudiantes con
características comunes.
Los datos se codificaron en función de las respuestas de los estudiantes a las preguntas
de la Figura 5.1 de planilla de los estilos de aprendizaje en cuatro formas básicas, que
se explican a continuación y se pueden ver en la Figura 5.2:
· Respuesta A (o respuesta 0): Es la primera respuesta del grupo de dos

respuestas posibles a una pregunta particular. Por ejemplo, para la pregunta
número 21) Prefiero estudiar: (a) en grupo. (b) solo, corresponde a la respuesta
en grupo, que según la codificación utilizada en la planilla corresponde a una
pregunta del tipo Activo/Reflexivo y por lo tanto la característica detectada será
Activo.
· Respuesta B (o respuesta 1): Es el caso contrario al anterior, donde se marco la

segunda respuesta del grupo. Tomando el mismo ejemplo, la pregunta número

21) Prefiero estudiar: (a) en grupo. (b) solo, corresponde a la respuesta solo, y
según la codificación utilizada será del tipo Reflexivo.
· Marcó ambas respuestas: Puede darse el caso que un alumno no haya

entendido la consigna y marque ambas respuestas. De cualquier manera, una
planilla con datos ambiguos todavía tiene valor para el análisis, ya que una
respuesta doble solo invalida a uno de los 11 grupos de preguntas en el peor de
los casos (en realidad es menos, ya que solo invalida la asociación, por ejemplo
del tipo Sensorial/Intuitivo, del grupo de cuatro preguntas).
· No marcó ninguna respuesta: Como en el caso anterior esta pregunta no

provee de ninguna información, pero esto no invalida el cuestionario, sino solo
una pregunta del grupo de cuatro, pero como todavía restan 10 preguntas en 10
grupos para poder encontrar el perfil del estudiante, la planilla continua siendo
útil.
Figura 5.1.a Figura 5.1.b Figura 5.1.c Figura 5.1.d

Figura 5.1: Respuestas posibles de los alumnos encuestados por medio de la planilla. Las opciones
válidas se pueden ver en 5.1.a y 5.1.b mientras que las opciones 5.1.c y 5.1.d son inválidas para la
interpretación correcta de la planilla.
Para entrenar una red neuronal del tipo S.O.M., se requieren valores numéricos como
origen de los datos (reales o enteros) para el entrenamiento. En el caso de faltar alguno
de los datos de un campo, se lo puede reemplazar por el promedio de todos los datos de
ese campo para no alterar la tendencia de la información y para no desechar ese registro.
Esto llevó a buscar una tercera codificación en el caso de información faltante en las
planillas (o la información ambigua, en el caso de las dobles respuestas). Se resolvió
categorizarla con un estado adicional, llamado 2. Por lo tanto, para las respuestas de las
preguntas se poseen tres estados posibles, el estado 0, para las respuestas del tipo A. El
estado 1, para las respuestas del tipo B y el estado 2 para todas los demás tipos de
respuestas.
El resto de los datos no requiere la introducción de estados adicionales para poder

codificar las anormalidades, ya que aquí todos los estudiantes llenaron los datos con los
valores deseados, es decir, ninguno omitió ni el sexo, ni la carrera, así como tampoco se
omitieron los años de entrada a la facultad y año de cursada.
Para el sexo se utilizó la siguiente convención arbitraria: el sexo masculino se codificará

con 0 mientras que el sexo femenino se codificará con 1.
Para la codificación de las carreras se tomó como base la codificación utilizada en el

nomenclador de carreras interno a la facultad de Ingeniería de la Universidad de Buenos
Aires, pero luego surgieron dos hechos que obligaron a tomar una codificación ajustada:
primero la carrera Ingeniería Electrónica, que se dicta en dicha facultad no está
contemplada en las planillas, ya que ninguno de sus estudiantes fue relevado por no
pertenecer a la materia Algoritmos y Programación I con código 75.40, sino que
pertenecen a la materia Algoritmos y Programación I con código 75.02, la cual no fue
relevada. La otra razón es que se intentó dejar que el código de carrera solo posea un

dígito y la cantidad de carreras relevadas es de 10, por lo tanto se las codifico del 0 al 9
como se muestra en la Tabla 5.3.
Carrera Código
Ingeniería Civil 1
Ingeniería Naval 2
Ingeniería Mecánica 3
Ingeniería Industrial 4
Ingeniería Química 5
Ingeniería Electricista 6
Ingeniería Agrimensura 7
Ingeniería Alimentos 8
Ingeniería Sistemas 9
Ingeniería Informática 0
Tabla 5.3: Codificación de las Carreras para
utilizar como entrada para la red S.O.M.
Las cifras de las edades, el año de ingreso y el año que actualmente está cursando el
estudiante son valores numéricos que no requieren una codificación previa para ser
procesados por la red, por lo tanto se los mantiene en el formato en el que son
relevados.
Esta codificación define las entradas de las redes del tipo S.O.M. de manera de que cada
uno de los atributos queda expresado en forma numérica, como solo soporta la
estructura de las redes autoorganizadas de Kohonen, ya que estas requieren trabajar con
los datos normalizados en el intervalo [0,1].
5.3 – Redes S.O.M. y Clusters Resultantes.
Una vez codificados los datos relevados, éstos fueron utilizados como entradas de una
red neuronal del tipo S.O.M. para obtener grupos de estudiantes con características en
común para intentar relacionarlos luego con los diferentes protocolos pedagógicos
utilizados en las sesiones con los estudiantes.
5.3.1 –Puesta a Punto de las Redes S.O.M.
No alcanza con configurar las características de las redes S.O.M., sino que se le debe
proveer de datos para el entrenamiento y la validación de los resultados (en este caso los
de las planillas relevadas). También se deben configurar parámetros adicionales, de
manera experimental (ya que los coeficientes óptimos dependen de los valores
ingresados como datos) para lograr la mejor clasificación. En la Figura 5.2 se puede ver
como varía la clasificación predicha por una red S.O.M. entrenada con 200 datos si la
cantidad de neuronas de salida es 2 o si es 3 (en el primer caso se generan 2 clusters de
salida, mientras que en el segundo se generan 3 clusters de salida).


Figura 5.2: Resultado de la clusterización con distinta cantidad de neuronas. 5.2.a: Muestra de 9 clusters
con 200 datos en total (3 neuronas para S.O.M.). 5.2.b: Muestra de 4 clusters con 200 datos en total (2
neuronas para S.O.M.).
La mayoría de los parámetros de la red S.O.M. surgen a través de un proceso iterativo,

donde se entrena la red y luego se analizan los resultados. Si los resultados son
satisfactorios (es decir, el error de entrenamiento es lo suficientemente pequeño), se
modifican levemente los parámetros para intentar mejorarlos aún más. Si los resultados
son poco satisfactorios comparado con corridas anteriores, se modifican en un valor más
elevado. Cabe señalar que para la obtención de los valores finales de entrenamiento de
la red neuronal se han probado más de cien combinaciones, logrando los mejores
resultados con la lista de parámetros que se observa en la Tabla 5.4.
Parámetro Valor
Número de Observaciones 121
Número de Variables 47
Cantidad de Neuronas Artificiales28 10
Cantidad de Ciclos 1000
Aleatoriedad Si
Parámetro de Aprendizaje
Inicial 0.9
Final 0.1
Función de decaimiento Exp
Parámetro para el vecindario Gaussiano
Inicial 99,0%
Final 01,0%
Función de decaimiento Exp
Tabla 5.4: Parámetros utilizados para el entrenamiento de las Redes
Neuronales S.O.M. con los que se clasificaron los datos de los alumnos.
Una vez fijados los parámetros para el entrenamiento de la red, solo resta comenzar el
entrenamiento de las mismas para obtener los clusters de datos, que se analizarán en la
próxima sección.
28
Si bien el valor hallado es muy elevado con respecto a la cantidad de clústers que se forman, esto sólo
agrega un retardo temporal en el entrenamiento de la red. Los valores para el caso presentado obtienen
un resultado similar utilizando, por ejemplo, 3 neuronas (9 clústers como máximo) en lugar de 10
neuronas artificiales (100 clústers como máximo).

5.3.2 – Resultados de la Aplicación de la Red S.O.M.
Una vez concluido el entrenamiento no supervisado de las redes S.O.M. con los
parámetros mencionados, en la Tabla 5.3 se procede al análisis de los datos resultantes.
En este paso se busca obtener:
· La cantidad de clusters: Si la cantidad de clusters es demasiado elevada,

puede que no exista una correlación entre tantos protocolos pedagógicos y los
clusters, ya que se parte de la hipótesis de que existen 3 protocolos
pedagógicos (los propuestos por la Teoría Uno). Una cantidad de clusters
reducida, por ejemplo solo uno indicará que los resultados no son utilizables
para la identificación de las características relacionadas con los protocolos
pedagógicos, ya que se utilizan dos cursos con métodos de enseñanza
diferentes. Por lo tanto el número de clusters que se busca obtener estará
acotado entre dos y tres.
· Los atributos más relevantes: La planilla contiene 44 preguntas distribuidas

en 11 grupos de 4 preguntas más 6 atributos adicionales. Es necesario que el
sistema pueda clasificar al estudiante realizando la menor cantidad de
preguntas (o requiriendo la menor cantidad de información al módulo del
estudiante). De esta manera se busca determinar cuáles atributos poseen la
mayor ganancia de información y cuáles no son requeridos para el análisis en
cuestión.
Los resultados que arrojó el entrenamiento de la des S.O.M. se resumen en la Tabla 5.5,
donde los elementos de cada cluster generado se encuentran totalizados y se indican los
porcentajes respectivos.
Cluster 1 Cluster 2
Datos con todos los atributos 6 (5.00%) 114 (95.00%)
Tabla 5.5: Resumen de elementos resultantes luego de aplicar redes neuronales S.O.M. a
los datos de entrada.
El resultado se encuentra dentro de la cantidad de clusters esperada y por lo tanto los

datos experimentales, concuerdan en la cantidad de clusters generados con la solución
propuesta29.
29
Cabe mencionar que en el entrenamiento aparece un Cluster 3, compuesto para ambos casos
únicamente del elemento número 83, que codificado para transformarse en una entrada de la red
S.O.M. resulta de la siguiente manera:
Carrera
Edad
Sexo
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
Pregunta
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
0 20 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
Una codificación “2” indica que el estudiante completó en forma errónea la pregunta (o no marcó ningún
casillero, o marco ambas respuestas en la misma pregunta), por lo que una vez encontrada la planilla de
estilos número 83, lo que la diferencia de las demás resulta claro, solo la mitad de las preguntas fueron

5.3.3 – Atributos Más Relevantes.
Luego se buscaron, los atributos más relevantes para clasificar los clusters generados.
Para entrenar las redes S.O.M. los valores son normalizados entre cero y uno para
adaptarse a la estructura de la red.
El entrenamiento de las redes con todos los atributos (44 preguntas más 6 atributos
adicionales) o solamente con los que presentan mayor ganancia de información no
modifica la cantidad de elementos de los clusters, pero puede modificar las reglas
generadas por el algoritmo C4.5. Por lo tanto, se requiere ver cómo influyen esas
variables en la clasificación final.
En las Figuras 5.3 a y b se pueden ver los valores medios de los clusters generados
entrenando la red S.O.M. con todos los atributos, o con los 9 que presentan mayor
ganancia de información, observando que los valores medios se mantienen casi
constantes, salvo la observación número 92 que es clasificada en forma diferente en los
dos entrenamientos, pero pudiendo concluir que para esta etapa del entrenamiento es
indistinto si se discrimina o no por los atributos mencionados (existe una diferencia
porcentual del 0.82%).
Los dos clusters tienen valores medios “no triviales” (ni 0 ni 1) porque están
compuestos por más de una observación, entonces no es suficiente encontrar algunas
relaciones entre los clusters y los valores de entrada de los atributos, es necesario
encontrar todas las relaciones y S.O.M. no provee información suficiente para tal fin,
por lo que se requiere utilizar el algoritmo de inducción C4.5.
Carrera Carrera
Preg. 44 Edad Preg. 44 1 Sexo
Preg. 43 1 Sexo Preg. 43 Preg. 1
Preg. 42 Preg. 1 Preg. 42 Preg. 2
0,8 0,8
0,6 0,6
Preg. 37 0,4 Preg. 6 0,4
Preg. 37 Preg. 7
0,2 0,2
0 0
Preg. 34 Preg. 9
Preg. 34 Preg. 10
-0,2 -0,2
Preg. 33 Preg. 10
Preg. 33 Preg. 11
Preg. 32 Preg. 11
Preg. 32 Preg. 12
Preg. 31 Preg. 12
Preg. 31 Preg. 13
Preg. 30 Preg. 13
Preg. 30 Preg. 14
Preg. 29 Preg. 14
Preg. 29 Preg. 15
Preg. 28 Preg. 15
Preg. 28 Preg. 16
Preg. 27 Preg. 16
Preg. 27 Preg. 17
Preg. 26 Preg. 17
Preg. 26 Preg. 18
Preg. 25 Preg. 18
Preg. 24 Preg. 19
Preg. 25 Preg. 19
Preg. 24 Preg. 20
Preg. 23
Preg. 22 Preg. 20
Preg. 21 Preg. 23 Preg. 21
Preg. 22
Figura 5.3.a: Valor medio de cada una de las Figura 5.3.b: Valor medio de cada una de las
variables normalizadas en relación a cada uno de variables normalizadas en relación a cada uno de
respondidas por el alumno (una carilla del cuestionario), mientras que el anverso se encontraba en blanco
(probablemente el estudiante no se dio cuenta que debía llenar ambas páginas, anverso y reverso, del
formulario). En la codificación se hace evidente, que después de la pregunta número 18 (última del
anverso del cuestionario) todos los valores del juego de datos son 2, lo que significa según la codificación
implementada, que son preguntas sin contestar y por lo que se descarta este dato para el análisis posterior.

sus clusters (utilizando 44 preguntas más 6 sus clusters (utilizando solo las 44 preguntas para
atributos para el entrenamiento). el entrenamiento).
Por tal motivo, la relevancia de un atributo para identificar un cluster no es un “proceso

simple”: se requiere una herramienta adicional para encontrar estos resultados para lo
cual se aplicará el algoritmo C4.5 a fin de realizar la inducción y la generación del árbol
de decisión y utilizar éste último para generar las reglas que describen a cada uno de los
clusters.
5.4 – Inducción, Árboles de Decisión y Reglas
Para identificar las variables que más información otorgan al proceso de identificación
de los protocolos pedagógicos y para cuáles de ellas su entropía es menor, se utilizará
un algoritmo C4.5 modificado. Originalmente, este algoritmo de inducción generaba
árboles de decisión donde cada una de las ramas del árbol conducía, luego de n pasos, a
hojas las cuales representan al 100% de las observaciones sin error de categorización.
En este caso se optó por permitir leves márgenes de error en la clasificación, de manera
que el error de categorización de cada una de las reglas, sea de un valor igual o inferior
al error de generalización de la muestra, esto supone que se está llevando a un máximo
valor la “confianza” (para conocer la medida de la exactitud de las reglas generadas).
Se utilizarán los estudios de Oates [Oates et al., 1997] como base para asegurar que la
cantidad de observaciones tomadas (incluyendo el error de generalización) permitan
generar reglas que se pueden aplicar a toda la población, sin que los casos particulares
no relevados disminuyan significativamente la precisión de las reglas generadas.
Se analizarán dos casos para intentar procesar los datos: el primero incluye a las 44
preguntas de la planilla más los 6 atributos adicionales para realizar la clasificación,
mientras que el segundo solo utiliza las 9 preguntas que más información otorgan. Con
esta discriminación se busca:
· Por un lado: Identificar la relevancia de las preguntas del cuestionario para la

pertenencia de un elemento de la muestra a cluster. Cuanto mayor sea el número
de atributos necesarios para la identificación de un cluster especifico, el sistema
deberá recabar mayor cantidad de datos por parte del estudiante, dificultando el
proceso de selección.
· Por el otro: Analizar cómo influye el conjunto de entradas en la complejidad del

árbol resultante y si en este caso se cumple que los árboles de menor
profundidad obtienen resultados comparables con los de una profundidad y
complejidad mayor, como plantea Oates [Oates et al., 1997; Oates et al., 1998] y
Quinlan [Quinlan, 1987].
Para resolver la primera cuestión se analizarán los resultados de aplicar C4.5 a los
atributos más relevantes, mientras que luego se aplicará al conjunto de todos los
atributos y preguntas. Una vez generadas todas las reglas, se deben analizar en forma
separada para ver:
· ¿Qué tan aplicables son las reglas generadas? Es decir, su soporte.

· ¿Cuál es la medida de la exactitud de las reglas generadas? O sea su confianza.
· ¿Qué parte del espacio predictor puede capturar una regla de manera exacta? O
su captura.
5.4.1 – Inducción Utilizando los Atributos con Mayor Ganancia de Información.
Como todos los datos son categóricos, las reglas generadas serán igualdades y no se
encontrarán rangos para ellas (como en el caso de los datos continuos). Para encontrar
los atributos con mayor ganancia de información, se requiere utilizar los primeros n
pasos del algoritmo C4.5. En este caso se tomaron los primeros nueve, resultando las
reglas que se presentan en la Tabla 5.6
Reglas Antecedente Consecuente

Regla 1 Si “Normalmente me consideran: Extrovertido” Entonces Cluster 2
Regla 2 Si “Normalmente no me consideran ni Extrovertido ni Entonces Cluster 1

Reservado”
Regla 3 Si “Recuerdo más fácilmente: Algo que he pensado mucho” Entonces Cluster 2
Regla 4 Si “Recuerdo no más fácilmente algo que he pensado Entonces Cluster 1

mucho o algo que hice”
Regla 5 Si “Aprendo: A un ritmo normal, metódicamente. Si me Entonces Cluster 2
esfuerzo, lo logro”.
Regla 6 Si “No aprendo a un ritmo normal, metódicamente ni a Entonces Cluster 1
tontas y a locas (desordenadamente)”.
Regla 7 Si “Cuando pienso en lo que hice ayer, la mayoría de las Entonces Cluster 2
veces pienso en: Imágenes”
veces pienso en: Palabras”
veces no pienso ni en palabras ni imágenes”
Tabla 5.6: Reglas resultantes de recorrer el árbol generado por el Algoritmo C4.5
En la Tabla 5.7 se observan las características antes mencionadas para cada una de las
reglas generadas, así como también el cluster que definen y la cantidad de antecedentes
que poseen cada una de ellas (la columna “largo” indica la distancia entre el nodo raíz
del árbol y la hoja de esa regla, el largo del nodo raíz Root es 0 y el largo de un nodo
cualquiera es el largo de su padre más uno).
Regla Cluster Largo Soporte Confianza Captura

0 Cluster 2 0 100,0% 94,0% 100,0%
1 Cluster 2 1 35,9% 100,0% 38,2%
2 Cluster 1 1 2,6% 100,0% 42,9%
3 Cluster 2 1 43,6% 96,1% 44,5%
4 Cluster 1 1 1,7% 100,0% 28,6%
5 Cluster 2 1 76,5% 94,4% 76,8%
6 Cluster 1 1 0,9% 100,0% 14,3%
7 Cluster 2 1 79,9% 95,7% 81,4%
8 Cluster 2 1 17,5% 95,1% 17,7%
9 Cluster 1 1 2,6% 66,7% 28,6%
Tabla 5.7: Características de cada una de las reglas generadas por el Algoritmo C4.5: donde se
detallan las características mínimas necesarias para analizar cada una de ellas.

Si “Normalmente me Si “Normalmente no me consideran

consideran: Extrovertido” Root ni Extrovertido ni Reservado”
Nodo 0
Nodo 1 Nodo 3
Si “Normalmente me
consideran: Reservado”
3 3
S: 36% S: 3%
C: 100% C: 100%
Si “Recuerdo más Si “No recuerdo más

fácilmente: Algo que he fácilmente algo que he
pensado mucho” pensado mucho o que hice”
Nodo 2
Nodo 5 Nodo 6
Si “Recuerdo más
fácilmente: Algo que hice”
3 2
S: 24% S: 2%
C: 100% C: 100%
Si “Aprendo: A un ritmo Si “No aprendo a un ritmo

normal, metódicamente. normal, metódicamente ni
Si me esfuerzo, lo logro”. desordenadamente”.
Nodo 4
Nodo 7 Nodo 9
Si “Aprendo: A tontas y locas
(Desordenadamente)”.
3 2
S: 29% S: 1%
C: 100% C: 100%
Si “Cuando pienso en lo que Si “Cuando pienso en lo que

hice ayer, la mayoría de las hice ayer, la mayoría de las
veces pienso en: Imágenes” veces pienso en: Palabras”
Nodo 8
Si “Cuando pienso en lo que hice ayer, la

mayoría de las veces no pienso ni en
Imágenes ni en Palabras”
Nodo 10 Nodo 11 Nodo 12
3 3 2
S: 4% S: 1% S: 1%
C: 100% C: 100% C: 100%
Figura 5.4: Esquema del árbol generado por el algoritmo C4.5. Se muestran los
nodos internos con sus valores y los clusters resultantes con su Soporte (S) y
Confianza (C) respectivamente.
La Figura 5.4 es la representación gráfica del árbol de decisión generado por el

algoritmo C4.5. Para generar cada una de las reglas es necesario partir desde la raíz del

árbol (root) y descender por los nodos interiores (numerados desde el 0, para el nodo
raíz hasta el 12) llegando a las hojas, donde se encuentra la clase resultante del camino
seleccionado y los datos asociados a su soporte y su confianza.
En la Tabla 5.8 se resumen los aspectos técnicos del algoritmo C4.5 y el tiempo
insumido en generar el árbol, podarlo y utilizar dicho árbol para evaluar el conjunto de
observaciones. En la misma tabla se detalla el porcentaje de datos mal clasificados en
las dos fases del algoritmo: la de entrenamiento y la de prueba posterior.
Característica Valor
Número Total de Nodos 12
Número de Nodos Hoja 9
Número de Niveles 5
% Error de Clasificación
En el conjunto de Entrenamiento 1.28%
En el conjunto de testeo 2.21%
Tiempo Insumido en el proceso

Procesamiento de Datos 10 Seg.
Crecimiento del Árbol 04 Seg.
Poda del Árbol 01 Seg.
Clasificación utilizando el árbol final 04 Seg.
Recorrido del árbol para generar reglas 01 Seg.
Tiempo Total Insumido 20 Sec.

Tabla 5.8: Resumen del árbol C4.5 generado, incluyendo los errores de
clasificación y el tiempo insumido desglosado del proceso.
Una vez analizada la representación gráfica del árbol, es necesario centrarse en cada uno
de los nodos, numerados de 0 al 12, para tener una idea precisa de cómo cada una de las
bifurcaciones influye sobre la clase resultante. De este modo se puede plantear un
ejemplo utilizando uno de los grupos de entrada cualquiera: seleccionando la
observación n=121 tal como se muestra en la Tabla 5.9, se buscará de clasificarla con el
árbol:
Protocolo Pedagógico Predicho 30
Protocolo Magistral
Carrera 9
Edad 19
Sexo Masculino
Entiendo un tema después de Pensarlo
Prefiero ser considerado como Realista
Cuando pienso acerca de lo que hice ayer, pienso en Imágenes
En general tiendo a Entender la estructura general
Cuando aprendo algo nuevo me ayuda Pensar acerca de ello
Si fuera profesor, preferiría enseñar En base a teorías e ideas
Prefiero obtener nueva información en forma de Dibujos y diagramas
Una vez que entiendo El tema en su conjunto
Estudiando en grupo, en temas difíciles Este sentado y escuche
Es más fácil para mi Aprender conceptos
En un libro con dibujos y esquemas Mire los dibujos y esquemas
Cuando resuelvo un problema de matemática Un paso a la vez
En el aula Raramente conozco a todos
Cuando leo libros que no son de ficción prefiero Libros de nuevos hechos
Prefiero docente que Muchos dibujos y diagramas
Cuando analizo una historia o novela Pienso acerca de los hechos
Cuando inicio la resolución de un problema Primero entiendo el problema
30
El valor 3 corresponde a la clasificación de la observación número 121 dada por la red S.O.M.
configurada con los parámetros mencionados en la sección A.3.3 – Clusters Resultantes del Anexo A.

Prefiero la idea de Teoría

Recuerdo mejor Lo que veo
Es más importante que el docente Sea claro y secuencial
Prefiero estudiar Solo
Probablemente sea considerado Creativo en como hacer el trabajo
Cuando recibo indicaciones para ir a un lugar uso Un mapa
Aprendo A ritmo normal
Preferiría primero Pensar en la solución
Cuando leo por placer, prefiero escritores Creativos e interesantes
Cuando veo un diagrama, recuerdo El dibujo
Cuando considero nueva información Trato de entender el esquema gral.
Recuerdo más fácilmente Alo que hice
Cuando tengo que realizar una tarea, prefiero Conocer como la llevare a cabo
Cuando alguien me muestra datos, prefiero Esquemas o gráficos
Cuando escribo un trabajo, prefiero Elaborar las partes desordenadas
Cuando debo trabajar en grupo, prefiero Pensar las ideas individualmente
La mejor alabanza para mi es que me digan Imaginativo
Cuando me reúno, normalmente recuerdo Como ellos reveían
Cuando estoy aprendiendo un tema nuevo, prefiero Conectar el tema con otros
Normalmente me consideran Reservado
Prefiero cursos que enfaticen Material abstracto
Para entretenerme prefiero Mirar televisión
Resúmenes de clases me resultan Muy útiles para mi
Realizar tareas grupales con una única nota Me desagrada
Cuando realizo cálculos extensos Chequeo los resultados
Recuerdo los lugares donde he estado Fácilmente y con precisión
Cuando resuelvo un problema en grupo, prefiero Pienso los pasos de la solución
Tabla 5.9: Observación número 121 como fue relevada de la planilla, con el cluster resultante
agregado luego de ser clasificado por el algoritmo C4.5
Para ver si esta observación está bien categorizada en el árbol se seguirán los nodos
desde el nodo 0 (root) descendiendo según los valores de los atributos de la
observación:
1. Se parte del nodo 0 marcado como Raíz (Root).

2. Se pasa al nodo 2 por que la respuesta a la pregunta “Normalmente me
consideran:” es “Extrovertido”.
3. Se pasa al nodo 4 Por que la respuesta a la pregunta “Aprendo:” es “A un ritmo
normal, metódicamente. Si me esfuerzo, lo logro”.
4. Se pasa al nodo 7 que es un nodo hoja y por lo tanto el final del recorrido.
5. Se pasa a la hoja que contiene el número de Cluster 3, con un soporte del 29% y
confianza del 100%. Aquí termina esta rama del árbol y por lo tanto se tiene
clasificada la observación inicial.
Se estudiará ahora, el mismo proceso, utilizando todos los atributos y preguntas y no

solo un subconjunto de estos, para validar las afirmaciones de Oates [Oates et al., 1998]
y Quinlan [Quinlan, 1987] entre otros, sobre el tamaño del árbol en relación el error
cometido, analizando en que tipo de ventajas redunda esto en el Sistema Tutor
Inteligente (STI).
5.4.2 – Comparación de Resultados.
En este caso se repite el proceso de aplicar el algoritmo C4.5 a las planillas de estilos de
aprendizaje clasificadas por la red S.O.M. pero utilizando todas las preguntas y todos
los atributos disponibles, para analizar como impacta sobre el conjunto de resultados la
cantidad de atributos de la muestra.

En la Tabla 5.10 se resumen los aspectos técnicos del algoritmo C4.5 para el árbol
generado con el atributo de la edad. En la misma tabla se detalla el porcentaje de datos
mal clasificados en las dos fases del algoritmo, la de entrenamiento y el posterior testeo.
Número Total de Nodos 18
Número de Nodos Hoja 13
Número de Niveles 6
% Error de Clasificación
En el conjunto de Entrenamiento 0.00%
En el conjunto de testeo 1.44%
Tiempo Insumido en el proceso

Procesamiento de Datos 20 Sec.
Crecimiento del Árbol 4 Sec.
Poda del Árbol 2 Sec.
Clasificación utilizando el árbol final 1 Sec.
Recorrido del árbol para generar reglas 1 Sec.
Tiempo Total Insumido 28 Sec.

Tabla 5.10: Resumen del árbol C4.5 generado. Incluyendo los errores de
clasificación y el tiempo insumido total desglosado del proceso.
Entonces, comparando las dos soluciones disponibles, las reglas generadas clasifican
aceptablemente a los 121 elementos, salvo que para el caso de utilizar solo 9 preguntas
de la planilla de estilos de aprendizaje, se recorren dos niveles de profundidad menos
que para el árbol generado teniendo en cuenta todos los atributos.
Ahora se debe analizar cómo influye el conjunto de entradas en la complejidad del árbol
resultante y como impactan las mejoras de los árboles complejos globalmente sobre el
modelo. Cuanto mayor sea la cantidad de variables a analizar, mayores serán los
requerimientos al módulo del estudiante y mayor será el trabajo que el STI en su
conjunto deberá realizar para satisfacer las necesidades básicas para poder seleccionar el
protocolo pedagógico más adecuado.
Oates [Oates et al., 1997] entre otros ha analizado varios algoritmos de “poda” (o
pruning en inglés) para recortar el tamaño de las reglas generadas a partir de un gran
número de observaciones. Oates ha encontrado que a medida que se aumenta el tamaño
de las observaciones iniciales, el tamaño de las reglas aumenta en forma lineal. Este
aumento en la cantidad de antecedentes de las reglas no aumenta significativamente la
precisión en la clasificación de las reglas.
Siguiendo a Quinlan [Quinlan, 1987], éste explica que si bien muchos sistemas han
desarrollados árboles de decisión complejos, acertados y eficientes, tienen la desventaja
de una complejidad excesiva que puede llevar a los expertos a la obtención de
resultados incomprensibles. Por lo tanto es cuestionable utilizar estructuras complejas,
si las simples se adaptan correctamente al modelo, introducen únicamente a un pequeño
error. En este aspecto Quinlan [Quinlan, 1987] esta de acuerdo con el trabajo The
Effects of Training Set Size on Decision Tree Complexity” [Oates et al., 1997] de Oates.
Según Last y Maimon [Last et al., 1998] la relación entre las entradas del modelo
(predicativas) y los objetivos (clasificación) se utilizan (dado el atributo de entrada) para
seleccionar los valores de las instancias que minimizan la función global de entropía de

ese atributo, una vez descartado ese atributo, se lo reemplaza por el valor seleccionado y
se continúan evaluando los atributos de igual manera hasta que todos los elementos
pertenezcan a la misma clase. Luego, se aplican los algoritmos de poda para minimizar
la profundidad de los árboles generados, sin perder el poder de clasificación.
Para el caso específico que se está evaluando, el error de clasificación al utilizar un

árbol mas sencillo, con un 33% menos de nodos, incrementa el error de clasificación del
5.98 % al 6.25% (un incremento solo del 0.27 %). Se lo puede resumir de la siguiente
manera:
· Árbol de 5 niveles y 12 nodos (figura 5.9.a), error de clasificación 5.98%.
· Árbol de 4 niveles y 8 nodos (figura 5.9.b), error de clasificación 6.25%.
De esta manera se llega a un resultado, para este caso en particular, como el propuesto
en los trabajos de Quinlan [Quinlan, 1986] y Oates [Oates et al., 1997] anteriormente
citados, brindado la ventaja adicional al utilizar el segundo árbol (con menos niveles y
menor cantidad de nodos), el Sistema Tutor Inteligente requiere menor cantidad de
información para seleccionar el protocolo pedagógico del estudiante y con información
de más fácil acceso (es más simple de conocer las respuestas a algunas preguntas claves
de la planilla que las respuestas a todo el cuestionario).
Ahora, solo es necesario resolver la inquietud de que protocolo pedagógico se relaciona

con que cluster obtenido para la solución particular sobre el dominio de Programación
Básica que esta en estudio para contrastar el modelo teórico planteado.
5.5 – Inferencia.
Se requiere ahora hallar la relación entre el estilo de aprendizaje y el protocolo

pedagógico que corresponde a cada grupo se tomaran los protocolos básicos que
describe Perkins [Perkins, 1995] en la Teoría Uno:
· La instrucción didáctica o Magistral

· El entrenamiento
· La enseñanza socrática
Por lo tanto la investigación se orienta en la búsqueda de la relación entre la

predilección de los alumnos de aprender de manera más eficiente y los protocolos
pedagógicos utilizados por los tutores humanos (profesores); Para ello como
parámetro orientador se usarán las notas de las evaluaciones parciales para establecer
dicha relación. Para llevar a cabo la inferencia, se plantearon las siguientes hipótesis:
1. La composición de estilos de aprendizaje (necesidades y preferencias de los

2. Aquellos estudiantes en los que el estilo de enseñanza no coincide con su


A partir de la segunda hipótesis para los alumnos aprobados se desprende, que el

protocolo mayoritario de preferencia deberá ser el que coincide con el utilizado en clase,
mientras que para los reprobados, el protocolo mayoritario debe encontrarse invertido.
Para verificar esta afirmación se entrenó una red del tipo Backpropagation con las
siguientes características:
o Se seleccionaron los aprobados del curso con profesor socrático más la mayoría
de los reprobados del curso con profesor magistral y se entrenó la red
considerando protocolo socrático.
o Se seleccionaron los aprobados del curso con profesor magistral más los
reprobados del curso con profesor socrático y se entrenó la red considerando
protocolo magistral.
Característica Observada Curso A Curso B

Alumnos Totales (Contabilizados para este análisis) 47 53
Alumnos que reprobaron la evaluación parcial y estaban en un
30 0
curso con distinto protocolo pedagógico
Alumnos aprobaron la evaluación parcial y estaban en un curso con
10 33
distinto protocolo pedagógico (invertido)
Alumnos Aprobados (sin importar si el protocolo es correcto o no) 7 20
Alumnos reprobados respecto de los aprobados, dentro del
75% 0%
subconjunto de los mal clasificados
Tabla 5.11: Resumen de los porcentajes obtenidos para el análisis de los estudiantes, discriminados por
cursos. Se observan los alumnos que reprobaron y no recibieron tutorías en el protocolo de su preferencia.
Realizando el entrenamiento de esta manera se logra suprimir el “ruido” que aportan los
grupos que quedan fuera del análisis. En la Tabla 5.11 se pueden ver los resultados de
los estudiantes discriminados por cursos, contabilizando alumnos totales, alumnos
reprobados clasificados como pertenecientes al cluster contrario al de la mayoría y el
porcentaje que relaciona a los alumnos reprobados y aprobados que además se
encuentran mal clasificados.
Para esta experiencia se entrenó la red del tipo Backpropagation y se obtuvo un ranking
(escala) de protocolos pedagógicos y no solo el más adecuado para una situación
particular, a fin de dar flexibilidad al módulo que almacena los contenidos. El esquema
de este tipo de redes se puede ver en la Figura 2.5 de la sección 2.2.4.5.1 – Redes
Backpropagation.
Para el entrenamiento de la red backpropagation se utilizaron aleatoriamente el 67% de

los datos (calificaciones) pertenecientes a la Tabla A.32 mientras que el 33% de los
datos restantes se utilizaron para validar el modelo generado. Luego de más de 100
entrenamientos de 1000 ciclos cada uno, donde se buscó minimizar el error en la red
resultante, se llegó a la conclusión que los valores óptimos para los parámetros de la red
son los que están ven en la Tabla 5.12.

% Error (Conjunto de Entrenamiento) 3.75%
% Error (Conjunto de Validación) 2.00%
Características de la Red
Neuronas de Entrada 13
Neuronas primera capa oculta 20
Neuronas Segunda capa oculta 20
Neuronas de Salida 2
Tabla 5.12: Resultados de los datos de entrenamiento de la red tipo
Backpropagation.
Este entrenamiento es válido ya que el error de la herramienta (3.75% para el conjunto

de entrenamiento y 2.00 % para el conjunto de validación) es menor que el error de los
elementos que quedaron fuera del análisis, que representan a los estudiantes que no
aprobaron la materia por no estudiar lo suficiente, aunque el protocolo pedagógico
coincidiera con la preferencia del estudiante (que es el 25%). Por lo tanto se puede
concluir que:
· El curso B está relacionado con el cluster 1: Ya que los errores inducidos por
elementos del cluster 2 dentro del Curso A están en un 75%. O en otras palabras,
la red clasifica al 75% de los estudiantes reprobados en el curso A como
pertenecientes al cluster B.
· El Curso A está relacionado con el cluster 2: Ya que no existe otra asignación

posible en este caso y además el porcentaje de error de clasificación y
reprobación es del 0%.
Perkins [1995] (en el capítulo 3: La enseñanza y el aprendizaje del libro la Escuela

Inteligente) plantea que a los estudiantes a los que se les presenta el contenido una la
lección utilizando un protocolo pedagógico en el cual el alumno no siente que se le
facilita su proceso de aprendizaje, se evidencia una tendencia superior a fallar en las
evaluaciones. Si en cambio, se presentan los contenidos utilizando un protocolo
pedagógico más adecuado al estilo de aprendizaje de cada estudiante (preferencia), su
rendimiento se incrementa. Los resultados obtenidos concuerdan con las afirmaciones
de Perkins, donde la red Backpropagation predice que la mayoría de los estudiantes
reprobados deberían haber recibido clases utilizando otro protocolo pedagógico.
· El protocolo Socrático está relacionado con el Cluster 2.

· El protocolo Magistral está relacionado con el Cluster 1.
De esta manera se obtiene el mismo resultado del paso inferencial a fin de poder
incorporar los resultados experimentales al diseño del módulo tutor en el marco de los
Sistema Tutor Inteligente (STI).
Se concluye, que se posee un módulo del tutor capaz de categorizar a los estudiantes
según sus características, dentro de alguno de los protocolos pedagógicos disponibles en
el sistema, para el caso en estudio, se poseían datos de 2 protocolos pedagógicos
(Magistral y Socrático) y en este caso se puede categorizar automáticamente a los
estudiantes dentro de cada uno de ellos, según sus preferencias para mejorar los
resultados de una sesión pedagógica.

Una ventaja adicional que se presenta al utilizar una red del tipo Backpropagation en
lugar de una red S.O.M. para entrenar en la detección del protocolo pedagógico más
adecuado es que la primera no solamente proporciona una única salida, sino que en
lugar de activarse una única neurona de salida, ambas neuronas se activan (tanto la que
indica el protocolo Magistral como el Socrático) entregando un puntaje, que es la
relación entre los datos de entrada y el elemento que representa esa neurona en
particular. De esta manera, en los casos donde se posean varios protocolos pedagógicos
en los cuales se pueda optar, se podrá seleccionar el segundo más adecuado si el
primero faltase en el módulo del dominio y así sucesivamente.
Esto se puede ilustrar por medio de un ejemplo, en el que la observación número 120 es
clasificada por la red Backpropagation entrenada. La neurona que representa al
protocolo pedagógico Socrático en la observación de entrada le obtiene un puntaje de
0.00453776, mientras que la neurona que representa al protocolo pedagógico Magistral
obtiene un puntaje de 0.99432725, por lo tanto el sistema decide implementar la sesión
de tutoría utilizando el protocolo pedagógico Magistral (ya que 0.99432725 >
0.00453776).

Capítulo 6 - Conclusiones
6.1 – Contribución Realizada a la Solución del Problema.
Se comenzó determinando el estado actual de las investigaciones sobre el tema de

tutorizado inteligente, partiendo como base de trabajos generales, desde el histórico
Acholar de Carbonell, hasta el moderno CircSim de Evens para analizar las
funcionalides básicas, los puntos fuertes y las debilidades de los Sistemas Tutores
Inteligentes implantados hasta la fecha de impresión de este trabajo.
Luego se continúo analizando los casos concretos de Sistemas Tutores Inteligentes que
comparten el dominio de aplicación de esta tesis, como el Meno Tutor de Wolf, el
Proust de Jonhson y el tutor Coach de Selker para determinar el estado de desarrollo de
los mismos. De esta manera quedan establecidos los fundamentos básicos que sustentan
a los distintos tipos de Sistemas Tutores Inteligentes, así como también el modelo
tripartito de módulos propuesto por Carbonell y extensamente utilizado en el ámbito de
los STI.
Se procedió luego al análisis de las interfaces, submódulos y componentes

fundamentales para detectar los fallos en las implementaciones previas y alterar una
estructura teórica con más de 35 años para soportar las nuevas tecnologías.
De esta manera quedan determinados los componentes necesarios para guiar a los
estudiantes en el proceso de aprendizaje, respondiendo a sus necesidades inmediatas y a
largo plazo de la manera más conveniente dados los recursos del sistema.
Se modelaron las partes por separado y se las integro dentro de la arquitectura planteada
de Sistema Tutor Inteligente, utilizando en el caso del submódulo de protocolos
pedagógicos las herramientas que brinda la Inteligencia Artificial (IA) para modelar el
comportamiento del sistema como un tutor humano. Se utilizaron redes neuronales y
demostraron, en el paso posterior de la validación del modelo, de ser aptas para la tarea
propuesta, clasificando a los distintos estudiantes de una manera satisfactoria y
funcionando como el pilar del módulo para la selección del protocolo pedagógico que
más se adapta a las necesidades del estudiante usuario.
Al validar el modelo con los datos reales, tanto para la triangulación de datos como para
el entrenamiento de las redes neuronales que soportan el modelo, se encontró que los
datos se adaptan muy satisfactoriamente a las condiciones de prueba, transformándose
así, no solo en una herramienta teórica valida para guiar a los estudiantes en el proceso
de aprendizaje, sino también en un instrumento practico, que permite implantaciones de
un Sistema Tutor Inteligente capaz de generar resultados satisfactorios mesurables y
útiles en un entorno real.
De esta manera queda cumplido el objetivo general, ya que para el modelo planteado, se
ha validado que es capaz de adaptarse a las necesidades y preferencias de los alumnos,
según sus estilos de aprendizaje. Además, cumple con la condición de ser un
instrumento adicional para realizar tutorizado “uno a uno” entre el estudiante y el tutor
virtual.
CONCLUSIONES Fernando A. Salgueiro 133

Queda cumplido también el objetivo de este trabajo de proveer una herramienta

adicional para los tutores humanos, quienes pueden relegar algunas de sus tareas que, ya
sea por falta de tiempo o recursos, no pueden cumplir de la forma más satisfactoria para
el estudiante, mientras que provee un soporte secundario para los alumnos que quieren
complementar sus conocimientos o regular su propio ritmo de aprendizaje.
Con el objetivo del trabajo cumplido, se provee al campo de los Sistemas Tutores
Inteligentes de una nueva herramienta, para facilitar la selección del protocolo
pedagógico adecuado, redundando esto en una ganancia, no solo para el desempeño del
STI en si mismo, sino en el estudiante, que es el componente humano fundamental que
hace útil al sistema y le brinda identidad. Así se pretende realizar un aporte y mejorar el
desempeño académico de los distintos estudiantes y por ende su calidad de vida.
H1) La composición de estilos de aprendizaje (necesidades y preferencias de los

La hipótesis 1 se valida ya que se ha encontrado una herramienta que es capaz de

determinar el estilo de enseñanza partiendo de la planilla de estilos de aprendizaje.
H2) Aquellos estudiantes en los que el estilo de enseñanza no coincide con su

Los estudiantes mayoritarios desaprobados (75%) son recatalogados, tanto por la red
neuronal S.O.M. como por la Backpropagation, como pertenecientes a otro protocolo
pedagógico que difiere del utilizado en las clases tomadas.
6.1.1 – Respuesta a las Preguntas de Investigación.
Se procederá ahora a contestar las preguntas de investigación propuestas en el Capítulo

1 con las deducciones que se obtuvieron del capítulo experimental. A continuación Se
presentara cada pregunta con su correspondiente respuesta:
Pregunta 1: ¿Cuál es la herramienta más adecuada para la toma de información para

luego ser procesada?
Respuesta 1: La herramienta es la planilla de estilos de aprendizaje se ajusta a las

necesidades para relevar información sobre las distintas preferencias de
los estudiantes con respecto a sus estilos de aprendizaje y a su vez su
formato permite un post-procesamiento como el realizado en este trabajo.
Pregunta 2: ¿Cuál es la mínima cantidad de muestras a tomar para que el desarrollo

sea válido y el error de generalización sea lo suficientemente pequeño
como para que los resultados sean aplicables en un caso real?.
Respuesta 2: Con 120 planillas y 120 juegos de notas, se puede obtener de una
población de 800 un error de generalización menor al 3%.
134 Fernando A. Salgueiro CONCLUSIONES

Pregunta 3: ¿En cuántos grupos o familias pueden organizarse los datos relevados?
¿Es este número aceptable para una relación lineal con los distintos
protocolos pedagógicos?.
Respuesta 3: Se pueden organizar en 2 grupos y este número esta dentro del rango de
los protocolos pedagógicos predichos por la Teoría Uno. Estos grupos
presentan características similares
Pregunta 4: De todos los atributos analizados por la herramienta: ¿Cuáles de ellos

tienen una ganancia de información mayor? Y a su vez, ¿Cómo quedan
expresados los grupos o familias en función de los tributos más
relevantes?.
Respuesta 4: Existen atributos que presentan una mayor ganancia de información y se

ha detectado que para las preguntas específicas de la planilla estos son:
1. Edad
2. Sexo
3. Carrera
Mientras que para los datos adicionales la mayor ganancia de

información se encuentra en los atributos:
1. Normalmente me consideran: Extrovertido / Reservado /

Ninguna.
2. Recuerdo más fácilmente: Algo que he pensado mucho / algo que
he hecho / ninguno.
3. Aprendo: A un ritmo normal, metódicamente. Si me esfuerzo, lo
logro / A tontas y locas (Desordenadamente) /Ninguna.
4. Cuando pienso en lo que hice ayer, la mayoría de las veces no
pienso ni en Imágenes ni en Palabras
En ambos casos, el orden en que se presentan es decreciente con respecto

a la ganancia de información.
Pregunta 5: La información requerida para la clasificación del estudiante: ¿estará

disponible en el módulo del estudiante o deberá agregarse a la estructura
general de un Sistemas Tutores Inteligentes (STI) un nuevo submódulo
para relevar y procesar la nueva información requerida?.
Respuesta 5: Existen para utilizar estilos de aprendizaje, toda la información necesaria

estará disponible dentro del módulo del estudiante y no requiere
interacción extra con la interfaz, y por lo tanto se mantiene la
independencia de los módulos así como también la estructura propuesta
por Carbonell. Si la información que se requiere para la identificación
adecuada de los protocolos pedagógicos no se encuentra disponible en el
sistema, esta debería ser ingresada directamente al módulo del tutor,
rompiendo la independencia de los módulos.

Pregunta 6: ¿Cada uno de los grupos o familias en las que los estudiantes se agrupan
pueden ser relacionadas con un protocolo específico? Y si la respuesta es
afirmativa, ¿Con que protocolo están relacionadas?.
Respuesta 6: Existe una forma de relacionar las familias generadas con las redes
neuronales S.O.M. y el protocolo pedagógico, utilizando las dos
hipótesis siguientes:
H1) La composición de estilos de aprendizaje (necesidades y

preferencias de los estudiantes) de cada estudiante determina el estilo de
enseñanza (o protocolo pedagógico) más adecuado.
La hipótesis 1 se valida ya que se ha encontrado una herramienta que es

capaz de determinar el estilo de enseñanza partiendo de la planilla de
estilos de aprendizaje.
Los estudiantes mayoritarios desaprobados (75%) son recatalogados,

tanto por la red neuronal S.O.M. como por la Backpropagation, como
pertenecientes a otro protocolo pedagógico que difiere del utilizado en
las clases tomadas, resultando que el Cluster 1 generado por S.O.M. esta
relacionado con el protocolo pedagógico Socrático, mientras que el
Cluster 2 generado por S.O.M. lo está con el protocolo Magistral
Pregunta 7: ¿Cómo reacciona la estructura de la solución propuesta ante el caso de

que el protocolo pedagógico requerido por el sistema se encuentre
faltante dentro del módulo del dominio?.
Respuesta 7: La utilización de una red Backpropagation en lugar de una S.O.M.

permite armar un ranking de protocolos más adecuados.
Pregunta 8: ¿Cómo la nueva estructura propuesta se adapta a las nuevas tecnologías?
Respuesta 8: Utiliza las nuevas tecnologías, sobre todo las de los ambientes
distribuidos, así como también las tecnologías que propone la
Inteligencia Artificial (IA).
Pregunta 9: ¿Qué impacto global tiene la propuesta dentro del marco especifico de los
Sistemas Tutores Inteligentes (STI)?.
Respuesta 9: Aporta una solución viable para la implementación de un STI capaz de

brindar a cada estudiante con el protocolo pedagógico que mejor se
adapte a cada estudiante, mejorando sus posibilidades de aprobación y
por ende combatiendo el problema de el alto índice de desaprobados.
136 Fernando A. Salgueiro CONCLUSIONES

6.2 – Futuras líneas de investigación
Esta investigación, si bien ha propuesto una solución sobre la selección de los

protocolos pedagógicos, no propone soluciones a temas que incluyen al sistema tutor
inteligente como un conjunto. La interacción no guiada, donde el sistema funciona
como un compañero, que presenta respuestas “posibles” a las inquietudes del estudiante
no puede ser tratada como un problema perteneciente solamente al módulo del tutor,
sino que comprende al Sistema Tutor Inteligente (STI) como un conjunto.
De esta manera se requiere un análisis mucho más profundo sobre la manera de

“encausar” una interacción no guiada para que conduzca a fines útiles y no caer en
casos donde toda la interacción gira en torno a un concepto pero, por no poder el
objetivo de la interacción correctamente, no puede dar con la solución.
A su vez, esto puede que quede fuera del campo de acción de los Sistemas Tutores
Inteligentes clásicos, para ingresar en el terreno de los Asesores Inteligentes, ya que el
sistema no “tutoriza” directamente al estudiante, sino más bien que “acompaña” en un
proceso de descubrimiento donde no existe un objetivo determinado, pero si existe la
necesidad de “guiar” o “asistir” al estudiante en este proceso de descubrimiento para
que rinda buenos resultados.
Por lo tanto una de las futuras líneas de investigación, para ampliar el desarrollo de este
trabajo es la de adaptar las ideas aquí planteadas a otras estructuras similares a la de los
Sistemas Tutores Inteligentes (STI), como pueden serlo los Asesores Inteligentes o
mismos Sistemas Tutores Inteligentes que no poseen un modelo de interacción
tradicional. De aquí también se desprende que las mismas ideas pueden ser adaptadas a
modelos en los que no se aplica el marco de referencia tripartito planteado por
Carbonell, adaptando y redistribuyendo los submódulos que desempeñan las tareas del
tutor a las nuevas estructuras, que, si bien difieren de la estructura clásica, deberán
seguir cumpliendo las mismas funciones y logrando los mismos objetivos.
Otro campo en el que la investigación puede seguir su curso es en el de agregado de

nuevos módulos a la estructura clásica. Se mantienen los tres módulos básicos, pero se
agregan módulos para ampliar los campos de aplicación del sistema, como puede ser el
módulo evaluador o el módulo ambiental, propuesto por varios autores. De esta manera,
las interfaces que unen a los diferentes módulos añadidos deberán ser definidas para que
la interacción con el módulo del tutor se realice de forma eficiente y sin la
superposición de funcionalidades que tanto ha demorado el desarrollo de Sistemas
Tutores Inteligentes implantables.

Bibliografía
Ackley, D. H.; Hinton,G. F.; Sejnowski, T. J. (1985). A learning algorithm for Boltzman
machines. Cognitive Science, 9, p 147-169.
Alpert, S. R.; Singley, M. K.; Fairweather, P. G. (1999). Deploying Intelligent Tutors on
the Web: Architecture and an Example. International Journal of Artificial
Intelligence in Education, 10, 183-197
Anderson, J. A.; Silverstein, J. W.; Ritz, S. A.; Jones, R.S. (1977). Distinctive features,
categorical perception, and probability learning: Some applications of a neural
model. Psychological Review, 84, 413-451. Reimpreso en Anderson y Rosenfeld
en 1988.
Ausubel, D.; Novak, J.; Hanessian, H. (1983) Psicología educativa: un punto de vista
cognitivo. México: Trillas.
Barr, A.; Feigenbaum, E. A. (1981). The Handbook of Artificial Intelligence. Volume I.
William Kaufman, Los Altos, CA.
Barto, A. G.; Sutton, R. S.; Anderson, C. W. (1983). Neuron like elements that can
solve difficult learning control problems. IEEE Transactions on Systems, Man,
and Cybernetics 13, p. 834-846.
Bhatt, K.; Evens ,M.; Argamon, S. (2004): Hedged Responses and Expressions of Affect
in Human/Human and Human/Computer Tutorial Interactions. Computer Science
Department, Illinois Institute of Technology. Proceedings of COGSCI 2004,
Chicago, IL
Boff, E.; Giraffa, L. M. (2000). Construyendo un ambiente de enseñanza-aprendizaje
cooperativo: una experiencia interdisciplinaria. En SBIE 2000 - Simposio
brasilero de informática educativa. Maceio, Halagaos. Anales. p. 112-119.
Bolan Frigo, L.; Pozzebon, E.; Bittencourt, G. (2004). O Papel dos Agentes Inteligentes
nos Sistemas Tutores Inteligentes. World Congress on Engineering and
Technology Education (WCETE'2004). Guarujá / Santos, SP. Proceedings of the
World Congress on Engineering and Technology Education.
Brown, E.; Palincsar, B. (1989) Guided, Cooperative learning and the individual
knowledge acquisition. En Resnick B. (comp.) Knowing, learning, and instruction.
Hillsdale. N.J.
Bruner, J. (1990). Actos de significado. Más allá de la revolución cognitiva. Alianza.
Madrid. 2002.
Bruno, O. (2003). Resultados de investigación acerca de los problemas de aprendizaje
de algoritmos. UTN.
Buchanan, B. G.; Shortliffe, E. H. (1984). Rule-Based Expert Systems: The MYCIN
Experiments of the Stanford Heuristic Programming Project. Addison-Wesley,
Reading, MA.
Buchanan, B. G.; Sutherland, G. L., and Feigenbaum, E. A. (1969). Heuristic
DENDRAL: a program for generating explanatory hypotheses in organic
138 Fernando A. Salgueiro BIBLIOGRAFÍA

chemistry. In Meltzer, B., Michie, D., and Swann, M., editors, Machine
Intelligence 4, p. 209-254. Edinburgh University Press, Edinburgh, Scotland.
Burton, R. R.; Brown, J. S. (1981). An investigation of computer coaching for informal
learning activities. In: Sleeman, D., Brown, J. (eds.): Intelligent Tutoring Systems,
Capitulo 4, p. 79-98, London: Academic Press.
Carbonell, J. R. (1970). AI in CAI: An artificial intelligence approach to computer
assisted instruction. IEEE transaction on Man Machine System. Volumen 11
número 4, p. 190-202.
Carpenter, G. A.; Grossberg, S.; Markuzon, N.; Reynolds, J.H.; Rosen, D.B. (1992).
Fuzzy ARTMAP: A neural network architecture for incremental supervised
learning of analog multidimensional maps. IEEE Transactions on Neural
Networks, 3, 698-713.
Carpenter, G. A.; Grossberg, S.; Reynolds, J.H. (1991). ARTMAP: Supervised real-time
learning and classification of nonstationary data by a self-organizing neural
network. Neural Networks, 4, 565-588.
Castillo, E.; Gutiérrez, J. M.; Hadi A. S. (1998). Sistemas Expertos y Modelos de Redes
Probabilísticas. Monografías de la Academia Española de Ingeniería, Madrid.
Cataldi, Z. (2004). Metodología para el diseño y evaluación de sistemas tutores
inteligentes. FI-UNLP. CAPIS. ITBA.
Cataldi, Z.; Figueroa, N.; Lage, F.; Denazis, J. (2003). Analysis of the interactions
between students taking part in problem based learning experiences using
software for groupware in an initial course of computer science engineering
career. Full Paper Aceptado en FIE 2003. 35th ASEE/IEEE Frontiers in
Education Conference. 5-8 de noviembre. Colorado.
Cheeseman, P. (1985). In defense of probability. In Proceedings of the Ninth
International Joint Conference on Artificial Intelligence (IJCAI-85), p. 1002-1009,
Los Angeles, California. Morgan Kaufmann.
Cho, B. (2000). Dynamic Planning Models to Support Curriculum Planning and
Multiple Tutoring Protocols in Intelligent Tutoring Systems. Ph.D. tesis, Illinois
Institute of Technology.
Clancey, W. J. (1991). Intelligent tutoring systems: A tutorial survey, en Applied
Artificial Intelligence: A Sourcebook. McGraw-Hill.
D.A.R.P.A. (1988). Neural Network Study. Defense advanced research projects agency
http://darpa.mil, AFCEA international press. p. 60. Consultado el 15/06/05
Dickinson, C. J.; Goldsmith, C. H.; Sackett, D. L. (1973). J. Clin. Computing, vol. 2, p.
42-50.
Duda, R. O.; Gaschnig, J. G.; Hart, P. E. (1980). Model Design in the Prospector
Consultant System for Mineral Exploration. En Michie, D., editor, Expert Systems
in the Microelectronic Age. Edinburgh University Press, Edinburgh, p. 153–167.
El Sheikh, E.; Sticklen, J. (1998). A Framework for Developing Intelligent Tutoring
Systems Incorporating Reusability. IEA-98-AIE: 11th International Conference on
Industrial and Engineering Applications of Artificial Intelligence and Expert
Systems, Benicassim, Castellon, España, Springer-Verlag (Lecture Notes in
Artificial Intelligence, vol. 1415).
BIBLIOGRAFÍA Fernando A. Salgueiro 139

Evens, M. W.; Spitkovsky, J.; Boyle, P.; Michael, J.; Rovick, A. A. (1993). Synthesizing
tutorial Dialogues. Preoceedings of the 15th Annual Conference of the Cognitive
Science Society.
Evens, M. W.; Stefan, B.; Ru-Charn, C.; Freedman; Glass, M; Hee Lee, Y.; Leem Seop,
Shim; Woo Woo, C.; Yuemei, Z.; Yujian, Z,; Joel, A. M.; Rovick, A. A. (2001).
CIRCSIM-Tutor: An Intelligent Tutoring System Using Natural Language
Dialogue. Twelfth Midwest AI and Cognitive Science Conference, MAICS 2001,
Oxford, OH, p. 16-23.
Fausett, L. (1994). Fundamentals of Neural Networks, Englewood Cliffs, NJ: Prentice
Hall.
Felder, R. M.; Baker-Ward, L. (1990). How engenieering students learn, how
engineering professor teach, and what goes wrong in the process. proceedings
ofthe 1990 frontiers in education conferenca, p 82-84.
Felder, R.; Soloman, B. (1998). Learning styles and strategies. Consultado el 21 de
junio de 2004 en www.2.ncsu.edu/unity/lockers/users/f/felder/ .
Feng-Jen, Y. (2001). Turn planning for Dialogue-Based Intelligent tutoring systems.
PhD tesis de PhD. Illinois Institute of Technology. Chicago Illinois.
Fernández, C. T.; Lima, M. D. De Alecar; Zuanásbar, D.; Adeche H. M. (2000)
ambiente de apoyo del desenvolvimiento de cursos hipermedia en la web. SBIE
2000- Simposio brasilero de informática educativa.Maceio, Halagaos. Anales. p.
24-31.
Fernández, I. (1989) Estrategias de Enseñanza en un Sistema Inteligente de Enseñanza
Asistida por Ordenador. Tesis Doctoral (Tercer Ciclo) de la Universidad del País
Vasco, San Sebastián.
Figueroa, N.; Cataldi Z.;Lage F. J.; Salgueiro F. A.; Costa G.; Rendón J. (2004). Nuevos
enfoques para el estudio del desgranamiento universitario. CAEDI 2004: IV
Congreso Argentino de enseñanza de Ingeniería. 1, 2 y 3 de Septiembre, ITBA,
Buenos Aires.
Figueroa, N.; Lage, F.; Cataldi, Z.; Denazis, J. (2003). Evaluación de las experiencias
para mejoramiento del proceso de aprendizaje en asignatura inicial de la carrera
ingeniería informática. International Conference on Engineering and Computer
Education, ICECE 2003, paper 804. 16-19 de Marzo San Paulo.
Freeva, R.; Evens, M. (1996). Generating and revising multi-turn text plans in STI.
Evens. Lecture Notes in Computer Science. Pp 632-640.
Friedberg, R. M..; Dunham, B.; North, T. (1959). A learning machine: Part II. IBM
Journal of Research and Development, 3(3):282-287.
Fukushima, K. (1975). Cognitron: a self-organizing multilayered neural network.
Biological Cybernetics, 20:121 - 136.
Fukushima, K. (1988). Neocognitron: A hierarchical neural network capable of visual
pattern recognition. Neural Networks, 1, p. 119-130.
García, M. (1995). El paradigma de Pensamiento del profesor. Editorial CEAC,
Barcelona.
García-Martínez, R. (1997). Sistemas Autónomos. Aprendizaje Automático. Editorial
Nueva Librería.

Garcia-Martinez, R.; Britos P. (2004). Ingeniería de sistemas expertos. Nueva librería,

Buenos Aires.
García-Martínez, R.; Servente; M. y Pasquini (2003) Sistemas Inteligentes. Nueva
Librería. ISBN 987-1104-05-7.
Gardner, H. (1993) Las inteligencias múltiples. La teoría en la práctica. Paidós.
Barcelona.
Gardner, H. (2003). Multiple Intelligences after twenty years. American Educational
Research Association.
Gelernter, H. (1959). Realization of a geometry theorem proving machine. In
Proceedings of an International Conference on Information processing, pages 273-
282, Paris. UNESCO House.
Gertner, A. S; Conati; C.; VanLehn, K. (1998). Learning Procedural help in Andes:
Generating hints using a Bayesian network student model. Research &
Development. American Association for Artificial Intelligence.
Giraffa, L. M. M.; Viccari, R. M. (1999). Intelligent tutoring system built using agent
techniques. Revista de educación, ciencia y cultura, Canoas: La Salle, p. 23-40.
Grossberg, S. (1976). Adaptive pattern classification and universal recoding: I. Parallel
development and coding of neural feature detectors. Biological Cybernetics 23, p
121-134.
Guardia Robles, B. (1993). Asesores Inteligentes para apoyar el proceso de enseñanza
de lenguajes de programación. Tesis de grado. Asesor. ITESM: Instituto
Tecnológico de Monterrey.
Gurney, K. (1995). Neural Nets Course. Brunel University. Internet
http://www.shef.ac.uk/psychology/gurney/notes/index.html. Consultado el
08/11/2005.
Haykin, S. (1999). Neural Networks: A comprehensive foundation. Prentice Hall 2nd.
edition.
Hebb, D. O. (1949). The Organization of Behavior, NY: John Wiley & Sons.
Hecht-Nielsen, R. (1988), Applications of counterpropagation networks. Neural
Networks, 1, 131-139.
Hernández, C.; García, P. (1991). Las teorías de la psicología educativa: análisis por
dimensiones educativas, México, Facultad de Psicología UNAM.
Hernandez Sampieri, C. (2001). Metodología de la investigación. Mc Graw Hil.
México.
Herrmann, N. (1996) The Whole brain business book, McGraw-Hill.
Hopfield, J. J. (1982). Neural networks and physical systems with emergent collective
computational abilities. Proceedings of the National Academy of Sciences, 79,
2554-2558. Reimpreso en Anderson and Rosenfeld (1988).
Hume G., Michael, J; Rovick, A.; Evens, M. (1996), Hinting as a tactic in one-on-one
tutoring. Journal of Learning Sciencies.

Hume G., Michael, J; Rovick, A.; Evens, M. (1997). The Use of Hints by Human and
Computer Tutors: The Consequences of the Tutoring . Illinois Institute of
Technology.
Hume, G. D. (1995). Using Student Modelling to Determine When and How to Hint in
an Intelligent Tutoring System Ph.D., Illinois Institute of Technology.
Hume, G.; Evens, M. (1992) Student modeling and the classification of errors
cardiovascular intelligent tutoring system. Proceedings of the 4th Midwest
Artificial Intelligence and Cognitive Science Society Conference, Utica, IL.
Hunt, E. B. (1975). Artificial Intelligence. New York. Academic Press, EE.UU.
Iglesias, C. A.; Garijo, C.; González, J. (2001). Metodologías orientadas a agentes.
Inteligencia Artificial. Revista Iberoamericana de Inteligencia Artificial. Número
6, Volumen 2. p. 12-23.
Jang, J. S. R.; Sun, C. T.; Mizutani, E. (1997). Neuro-fuzzy and Soft Computing.
Prentice-Hall, 1997, page 184.
Johnson, W. L. (1986). Intention-based diagnosis of novice programming errors.
Morgan-Kauffman.
Kawasaki, E. I.; Imar, N.; Fernández, C. T. (2000). Un modelo de sistema de tutoría
inteligente basado en principios pedagógicos para educación de adultos. En SBIE
2000: Simposio brasilero de informática educativa. Maceio, Halagaos. Anales. p.
154-159.
Keefe, J. (1988). Aprendiendo Perfiles de Aprendizaje. Asociación. Nacional de
Escuelas Secundarias.
Kim, J. H. (1989). CIRCSIM-Tutor: An Intelligent Tutoring System for Circulatory
Physiology. Ph.D. tesis, Illinois Institute of Technology.
Kim, J. H. (2000) Natural Language Analysis and Generation for Tutorial Dialogue.
Ph.D. tesis, Illinois Institute of Technology.
Kinshuk, D. (1996). Effectiveness of Intelligent Tutoring Tools Interfaces in relation to
Student, Learning Topic and Curriculum Characteristics. Tesis de doctorado en
De Montfort University, Leicester, Inglaterra.
Klopf, A. H. (1986). A drive-reinforcement model of single neuron function. InDenker,
J. S., editor, neural networks for computing: AIP Conf. Proc. Volume 151. New
York: American Institute of Physics.
Kohonen, T. (1988). Self-Organizing Maps Springer Series in Information Sciences.
Vol. 30, Springer, Berlin, Heidelberg, NY. P. 236.
Kohonen, T. (2001). Self-Organizing Maps, third edition. Springer series in information
sciences. Ed Springer.Helsinki University of Technology Neural etworks Research
Centre. P. 286-310. Pitman, London.
Konzen, A. A. (1995) Uma estratégia de ensino híbrida para sistemas tutores
inteligentes. En: Simposio Brasilero de Informática en Educación, 1995,
Florianópolis, Brasil. Imprensa Universitária da Universidade Federal de Santa
Catarina, p.327–338.
Kosko, B. (1988). Bidirectional associative memory. IEEE Trans. Syst., Man, Cybern.,
vol. 18, p. 49–60.

Krishnamoorthy, C. S.; Rajeev, S. (1996). Artificial Intelligence and Expert Systems for
Engineers. CRC Press, CRC Press LLC.
Laird, J. E., Newell, A., and Rosenbloom, P. S. (1987). SOAR: an architecture for
general intelligence. Artificial Intelligence, 33(1): 1-64.
Last, M.; Oded, M. (1998) A Compact and Accurate Model for Classification .
Department of Information Systems Engineering, Ben-Gurion University of the
Negev, Beer-Sheva 84105, Israel.
Lighthill, J. (1973). Artificial intelligence: A general survey. In Lighthill, J., Sutherland,
N. S., Needham, R. M., Longuet-Higgins, H. C., and Michie, D., editors, Artificial
Intelligence: A Paper Symposium. Science Research Council of Great Britain,
London.
Madoz, C; DeGiusti, A. (1997) Vinculacion de un curso interactuvi multimedial.
Congreso Argentino de Ciencias de la Computación. CACIC97. La Plata. UNLP.
Maturana, H. (1998) Da Biologia à Psicologia Artmed Editora Ltda..
Minsky, M. (1974). A Framework for Representing Knowledge. MIT-AI Laboratory
Memo 306. Reimpreso en The Psychology of Computer Vision, P. Winston,
McGraw-Hill, 1975. versión corta en J. Haugeland, Mind Design, MIT Press,
1981, and in Cognitive Science, Collins, Allan and Edward E. Smith. Morgan-
Kaufmann, 1992.
Minsky, M. L. (1954). Neural Nets and the Brain-Model Problem (SNARC). PhD thesis,
Princeton University.
Myers, I., Briggs, K. (1962) The Myers-Briggs Type Indicator, Princeton Educational
testing Services.
Nakabayashi, K., Maruyama, M., Kato, Y., Touhei, H., & Fukuhara, Y. (1997).
Architecture of an Intelligent Tutoring System on the WWW, in: B.D. Boulay and
R. Mizoguchi (Eds.), Proceedings of AI-ED'97, World Conference on Artificial
Intelligence in Education, Kobe, Japan, 18–22 August 1997. IOS, Amsterdam,
1997, pp. 39–46.
Narendra, K. S.; Thathachar, M. A. (1974). Learning Automata: A Survey. IEEE
Transactions on Systems, Man, and Cybernetics, vol. 14, p. 323-334.
Newell, A. (1969). Heuristic programming, in Ill-Structured Problems in Progress in
Operations Research. Ed. I. S. Aronofsky, John Wiley and Sons, New York.
Nilson, N. (1995). Principles of Artificial Intelligence. Nils Nilson Editors.
Nilson, N. (2001) Inteligencia Artificial. Una nueva síntesis. Mc Graw-Hill
Interamericana de España.
Oates, T. D. J. (1997). The Effects of Training Set Size on Decision Tree Complexity.
Proc. 14th International Conference on Machine Learning
Oates, Tim, David Jensen. (1998). Large Datasets lead to overly complex models: an
explanation and a solution. Experimental Knowledge Systems laboratory.
Department of computer Science. University of Massachusetts. Amherst, MA
01003-4610
Patel, A.; Kinshuk. (1996). Knowledge Characteristics: Reconsidering the design of
Intelligent Tutoring Systems. CAL Software Engineering & Research Centre 8.1-

8.3, Bosworth House, De Montfort University The Gateway, Leicester LE1 9BH
Phone/Fax: (44) 116 257 7193.
Perkins, D. (1995) La escuela inteligente. Gedisa.
Piaget, J.(1989). La construcción de lo real en el niño. Crítica. Grijalbo.
Platon (2001), la Republica. Ed Tecnos. Reimpresion 2001.
Quinlan, J. R. (1987). Simplifying Decision Trees. Simplifying Decision Trees.
International Journal of Man-Machine Studies 27(3): 221-234.
Quinlan, J. R. 1993. C4.5: Programs for Machine Learning. Morgan Kaufmann.
Rosenblatt, F. (1958), The perceptron: A probabilistic model for information storage
and organization in the brain. Psychological Review, 65, p. 386-408.
Rovick, A.; Brenner L. (1983). HEARTSIM: A Cardiovascular Simulation with Didactic
Feedback. The Physiologist, vol. 26 no. 4, p. 236-239.
Rovick, A.; Michael J. (1986). CIRCSIM: IBM-PC Computer Teaching Exercise on
Blood Pressure Regulation. Proceedings XXX Congress of International Union of
Physiological Sciences, Vancouver, Canada. p. 138.
Rumelhart, D. E.; Hinton, G. E.; Williams, R. J. (1986). Learning internal
representations by back-propagating errors in Parallel Distributed Processing:
Explorations in the Microstructure of Cognition. Eds. Cambridge, MA: MIT
Press, vol. 1, p. 318-362.
Russell,S.J. y Norvig P. (2003). Artificial Intelligence: A Modern Approach (2nd
Edition). Prentice Hall.
Sejnowski, T. J. (1977). Storing covariance with nonlinearly interactingneurons.
Journal of Mathematical Biology, 4 (4), 303–321.
Self, J. (1998). The defining characteristics of intelligent tutoring systems research:
STIs care, precisely. Computer Based Learning Unit University of Leeds, Leeds
LS2 9JT, England. Luego publicado en el International Journal of Artificial
intelligence in education (1999), Leeds, England.
Selker, T. (1989). Cognitive Adaptive Computer Help (COACH). 4th Intl. Conference
on AI and Education, Elsevier Science Publishers.
Seu, Jai, Ru-Charn Chang, Jun Li, Evens, M.; Michael, J. and Rovick, a. (1991).
Language Differences in Face-to-Face and Keyboard-to-Keyboard tutoring
Session. Proceedings of the Cognitive Science Society.
Shah, F. (1997). Recognizing and Responding to Student Plans in an Intelligent
Tutoring System: CIRCSIM-Tutor Ph.D. tesis, Illinois Institute of Technology.
Sierra, E., Hossian, A. y García Martínez, R. (2001). Selección de Estrategias
Instruccionales. Abordaje desde la Teoría del Conocimiento. Revista del Instituto
Tecnológico de Buenos Aires. Volumen 25. Páginas 24-36.
Sierra, E.; García-Martínez, R.; Cataldi, Z.; Britos, P.; Hossian, A.(2003). Sistemas
Tutoriales Inteligentes Centrados en Reparación de Mecanismos. Una Propuesta
Metodológica de Diseño. Revista Latinoamericana de Tecnología Educativa.
Volumen 1 N° 1. Páginas 19-30. Facultad de Educación. Universidad de
Extremadura.

Slagle, J. R. (1963). A heuristic program that solves symbolic integration problems in

freshman calculus. Journal of the Associationfor Computing Machinery. Feldman.
Stevens, A.; Collins, A. (1977). The goal structure of a Socratic tutor. In Proceedings of
the National ACM Conference. New York: ACM.
Stuart J. R.; Norvig, P.; Canny, J. F.; Malik, J. M.; Douglas D. E. (1995). Artificial
Intelligence A Modern Approach. Prentice Hall, Englewood Cliffs, New Jersey
07632.
Turing, A. (1950). Computing machinery and intelligence. Mind, vol. LIX, no. 236, p.
433-460.
VanLehn, K (1988). Student Modelling. M. Polson. Foundations of Intelligent Tutoring
systems. Hillsdale. N.J. Lawrence Erlbaum Associates, 55-78
Vigotsky, L. (1978) Mind in society. The development on Higher psychological process.
Harvard University Press Cambridge M.A
Villareal Goulart R. R.; Giraffa M. L. (2001). Arquitecturas de Sistemas Tutores
Inteligentes .
Walsh, T. (1987). PLATO: Predicate Logic Advisory Tool. M.Sc. thesis, Department of
Artificial Intelligence, University of Edinburgh.
Wan, E.A. (1990). Temporal backpropagation: An efficient algorithm for finite impulse
response neural networks. in Proceedings of the 1990 Connectionist Models
Summer School, Touretzky, D.S., Elman, J.L., Sejnowski, T.J., Hinton, G.E., eds.,
San Mateo, CA: Morgan Kaufmann, pp. 131-140.
Wee, W. G. (1968). Generalized Inverse Approach to Adaptive Multiclass Pattern
Classification. IEEE Transactions on Computers, Vol. C-17, pp. 1157-1164.
Wenger, E. (1987). Artificial intelligence and tutoring systems. Computational and
Cognitive Approaches to the Communication of Knowledge. Los Altos C. A.
Morgan and Kaufman.
Werbos, P.J. (1990). Backpropagtion through time: What it is and how to do it.
Proceedings of the IEEE, 78, p.1550-1560.
Widrow, B.; Hoff, M. E. (1960). Adaptive switching circuits. WESCON Convention
Record. part 4, pp. 96-104. Reimpreso en Reprinted in Anderson and Rosenfeld
(1988).
Winograd, T. (1972). Understanding natural language. Cognitive Psychology,
3(l).Reprinted as a book by Academic Press.
Wolf, B. (1984). Context Dependent Planning in a Machine Tutor. Ph.D. Dissertation,
University of Massachusetts, Amherst, Massachusetts.
Woo Woo, C. (1991). Instructional planning in an Intelligent Tutoring System:
Combining global lesson plan with local discourse control. Degree of Doctor of
Philosophy in Computer Science in the Graduate School of the Illinois Institute of
Technology. Chicago, Illinois. December, 1991.
Woods, W. A. (1973). Progress in natural language understanding: An application to
lunar geology. In AFIPS Conference Proceedings, volume 42, p. 441-450.
Yang A., Kinshuk & Patel A. (2002). A Plug-able Web-based Intelligent Tutoring
System. In S. Wrycza (Ed.) Proceedings of the Xth European Conference on

Information Systems (June 6-8, 2002, Gdańsk, Poland), Gdansk, Poland. paginas
1422-1429.
Zeve C. M. D.; Sloczinski H.; Polonia E.; Nitz-Ke J. A.; Lima J. V. (2000) Aprendizaje
colaborativo: la utilización de cd-rom e Internet en un sistema integrado. En
SBIE 2000: Simposio brasilero de informática educativa.Maceio, Halagaos.
Anales. p. 66-72.
Zurada, J. M. (1992). Introduction to Artificial Neural Systems. West Publishing
Company.

Anexo A: Datos Experimentales para el
Submódulo Pedagógico
A.1 – Introducción
Este Anexo contiene la información relevada a través de las planillas de estilos de

aprendizaje, así como también el procesamiento realizado para llegar a las conclusiones
que se detallaron en el Capítulo 5. Como ya se señalo, las planillas de estilos de
aprendizaje se clasifican en once grupos de cuatro preguntas cada uno. Cada pregunta
del grupo se utiliza para categorizar a un estudiante dentro de la clasificación. Así, la
pregunta 1 de todos los grupos corresponde a la clasificación: Tareas activas – Tareas
de reflexión: (forma de procesar la información), la pregunta 2 a la clasificación
Sensorial – Intuitiva (racional) (forma de percibir la información), la pregunta 3 a la
clasificación Visual – Verbal (forma de presentar la información) y la pregunta cuatro a
la clasificación Secuencial – Global (forma del proceso del aprendizaje) y así hasta la
pregunta 44. Es decir, cada pregunta de clasificación se repite totalizando once grupos.
Se suman también los datos básicos para caracterizar al estudiante, como la carrera,
universidad, el año de ingresó a dicha universidad, el año que cursa con respecto al plan
de estudio de su carrera, la carrera seleccionada dentro de la universidad, la edad del
estudiante y el sexo.
Estas planillas fueron relevadas durante los años 2004-2005 para las materias de
Programación Básica de la Facultad de Ingeniería de la Universidad de Buenos Aires
tomando una muestra representativa a fin de trabajar con un error de generalización se
encontrara por debajo de valores aceptables, del padrón total de estudiantes
matriculados en el área. En este caso el error de generalización es menor al 5%.
A.2 – Planillas de Estilos de Aprendizaje
En esta sección se muestran los resultados obtenidos a partir de los datos de los estilos
de aprendizaje. Se muestran por separado los datos obtenidos para los alumnos de la
materia Computación (75.01) y para la materia Algoritmos y Programación I (75.40)
ambas del área de Programación Básica. Los datos se presentarán en grupos de 4
preguntas para facilitar su lectura.
En la sección A.2.1.- Datos obtenidos para la materia Computación se pueden ver los
valores resultantes de las planillas para la materia Computación (75.01), mientras que
cada uno de los once grupos de preguntas se pueden ver en las Tablas A.1 hasta A.11.
Los valores resultantes de las planillas para la materia Algoritmos y Programación I

(75.40) se pueden ver en la sección A.2.2.- Datos obtenidos de la materia Algoritmos y
programación I y cada uno de los once grupos de preguntas se pueden ver en la Tabla
A.12 hasta la Tabla A.22.
ANEXO A Fernando A. Salgueiro 147

A.2.1 – Datos Obtenidos para la Materia Computación
Se presentan los datos obtenidos a partir de las planillas de estilos de aprendizajes

correspondientes a los alumnos de la materia Computación de la Facultad de Ingeniería
de la Universidad de Buenos Aires, materia incluida dentro del área de Programación
Básica.
A.2.1.1 – Primer Grupo
Se transcriben los datos relevados de los alumnos de la materia Computación

pertenecientes al primer grupo de cuatro preguntas de la planilla. Éstos se pueden ver en
la Tabla A.1
Activo Sensorial Visual Secuencial

Carrera Edad Sexo
Reflexivo Intuitivo Verbal Global
Civil 20 M Activo Intuitivo Visual Global
Naval 20 M Activo Intuitivo Visual Global
Mecánica 20 M Activo Intuitivo Verbal Global
Industrial 21 M Activo Sensorial Visual Global
Química 20 F Activo Sensorial Visual Secuencial
Industrial 24 M Activo Intuitivo Verbal Secuencial
Industrial 23 F Activo Sensorial Visual Global
Química 19 F Activo Intuitivo Visual Global
Civil 19 F Activo Intuitivo Visual Global
Electricista 24 M Activo Intuitivo Visual Global
Industrial 22 M Activo Sensorial Visual Secuencial
Civil 21 M Activo Intuitivo ? Secuencial
Industrial 20 M Activo Intuitivo Visual Secuencial
Química 18 M Reflexivo Sensorial Visual Global
Química 29 M Activo Sensorial Visual Secuencial
Industrial 19 M Activo Sensorial Verbal Global
Química 18 M Activo Sensorial Visual Global
Industrial 19 M Reflexivo Sensorial Visual Secuencial
Civil 19 M Activo Sensorial Visual Global
Civil 20 M Activo Sensorial Visual Secuencial
Química 21 M Activo Sensorial Verbal Global
Civil 21 M Reflexivo Sensorial Visual Global
Industrial 21 M Activo Intuitivo Visual Global
Química 19 F Activo Sensorial Visual Global
Química 21 M Reflexivo Intuitivo Verbal Global
Civil 22 M Activo Sensorial Verbal Global
Industrial 21 M Reflexivo Intuitivo Visual Global
Mecánica 19 M Reflexivo Intuitivo Visual Global
Civil 20 M Activo Sensorial Verbal Secuencial
Industrial 21 M Activo Sensorial Verbal Secuencial
Agrimensura 20 M Activo Sensorial Visual Global
Química 22 F Activo Intuitivo Visual Secuencial
Industrial 19 M ? Sensorial Visual Global
Industrial 20 M ? ? ? Global
148 Fernando A. Salgueiro ANEXO A


Mecánica 27 M Activo Sensorial Visual Global
Química 20 F Reflexivo Sensorial Visual Global
Química 20 M Reflexivo Sensorial ? Global
Mecánica 23 M Activo Sensorial Visual Secuencial
Alimentos 20 M Activo Intuitivo Visual Global
Mecánica 24 M Activo Intuitivo Visual Secuencial
Mecánica 20 M Activo Intuitivo Verbal Secuencial
Electricista 29 M Reflexivo Sensorial Verbal Global
Mecánica 23 M Activo Intuitivo Visual Global
Agrimensura 24 M Activo Sensorial Verbal Secuencial
Naval 20 M Reflexivo Sensorial Visual Global
Naval 22 M Activo Sensorial Visual Global
Mecánica 24 M Reflexivo ? Visual Global
Química 18 M Activo Intuitivo Visual Global
Alimentos 20 F Activo Intuitivo Visual Global
Tabla A.1: Primer grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con los
datos de la carrera, el sexo y la edad del estudiante.
A.2.1.2 – Segundo Grupo
A continuación se transcriben los datos relevados de los alumnos de la materia

Computación pertenecientes al segundo grupo de cuatro preguntas de la planilla. Éstos
se pueden ver en la Tabla A.2

Carrera Edad Sexo
Civil 20 M ? Sensorial ? Secuencial
Industrial 23 F Activo Sensorial Visual Secuencial
Civil 19 F Activo ? Visual Global
Electricista 24 M Activo Sensorial Visual Global
Industrial 22 M Reflexivo Sensorial Verbal Global
Química 18 M Activo Intuitivo Visual Secuencial
Industrial 20 M Reflexivo Intuitivo Verbal Secuencial
Industrial 20 M Reflexivo Sensorial Visual Global
Civil 19 M Reflexivo Sensorial Verbal Secuencial
Química 21 M Reflexivo Sensorial Verbal Secuencial
Civil 21 M Reflexivo Intuitivo Verbal Global
Química 19 F Activo Intuitivo Verbal Global

Industrial 22 M Reflexivo Sensorial Verbal Secuencial

Mecánica 19 M Reflexivo Sensorial Visual Global
Agrimensura 20 M Activo Sensorial Visual Secuencial
Industrial 20 M ? Sensorial Visual ?
Industrial 21 F Activo Sensorial Verbal Secuencial
Química 20 F Reflexivo Sensorial Verbal Global
Mecánica 27 M Reflexivo Sensorial Verbal Global
Química 20 F Activo Sensorial Verbal Global
Industrial 21 F Reflexivo Sensorial Visual Global
Alimentos 20 M Reflexivo Sensorial Verbal Global
Civil 20 M Activo Intuitivo Verbal Global
Naval 20 M Reflexivo Sensorial Verbal Global
Naval 22 M Activo Sensorial Visual Global
Química 18 M Reflexivo Sensorial Visual Secuencial
Alimentos 20 F ? Sensorial Visual Global
Tabla A.2: Segundo grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con
los datos de la carrera, el sexo y la edad del estudiante.
A.2.1.3 – Tercer Grupo

Computación pertenecientes al tercer grupo de cuatro preguntas de la planilla. Éstos se
pueden ver en la Tabla A.3

Carrera Edad Sexo
Naval 20 M Activo Intuitivo ? Secuencial
Industrial 23 F Reflexivo Sensorial Visual Secuencial
Civil 19 F Activo Intuitivo Verbal Secuencial
Electricista 24 M Activo Sensorial Visual Global

Civil 21 M Reflexivo Sensorial Visual Secuencial

Industrial 20 M Activo Intuitivo Visual
Química 29 M Activo Sensorial Verbal Secuencial
Civil 19 M Activo Intuitivo Visual Secuencial
Civil 19 M Activo Intuitivo Verbal Secuencial
Civil 20 M Activo ? Visual Secuencial
Química 21 M Activo Sensorial Verbal Secuencial
Química 21 M Activo Intuitivo Verbal Secuencial
Civil 22 M Activo Intuitivo ? Secuencial
Mecánica 19 M Reflexivo Intuitivo Verbal Secuencial
Industrial 21 M Reflexivo Intuitivo Visual Secuencial
Agrimensura 20 M Activo Intuitivo Visual Secuencial
Química 18 F Reflexivo Intuitivo Verbal Global
Industrial 20 M ? ? Visual Secuencial
Industrial 21 M Activo Intuitivo Visual ?
Química 20 F Reflexivo Sensorial Visual Secuencial
Mecánica 27 M Reflexivo Sensorial Visual Secuencial
Química 20 M Reflexivo Intuitivo Verbal Secuencial
Mecánica 23 M Reflexivo Intuitivo Visual Secuencial
Química 19 F Activo Sensorial Verbal Secuencial
Mecánica 23 M Activo Sensorial Verbal Secuencial
Alimentos 20 M Activo Intuitivo Visual Secuencial
Química 20 F Activo ? Visual Secuencial
Electricista 29 M Activo Intuitivo Visual Secuencial
Agrimensura 24 M Activo Intuitivo Verbal Global
Naval 20 M Activo Intuitivo Visual Secuencial
Naval 22 M Activo Sensorial Visual Secuencial
Industrial 20 M Activo Sensorial ? Secuencial
Alimentos 20 F Activo Intuitivo Visual Secuencial
Tabla A.3: Tercer grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con los

A.2.1.4 – Cuarto Grupo

Computación pertenecientes al cuarto grupo de cuatro preguntas de la planilla. Éstos se

Carrera Edad Sexo
Química 20 F Reflexivo Intuitivo Visual Global
Industrial 24 M Reflexivo Intuitivo verbal Secuencial
Química 19 F Reflexivo Intuitivo Visual Secuencial
Civil 19 F Reflexivo Intuitivo verbal Secuencial
Electricista 24 M Activo Sensorial Visual Secuencial
Química 18 M Reflexivo Intuitivo verbal Global
Civil 19 M Reflexivo Intuitivo Visual Global
Civil 19 M Reflexivo Intuitivo Visual Secuencial
Civil 20 M Activo Intuitivo verbal Secuencial
Civil 21 M Reflexivo Intuitivo verbal Global
Química 21 M Reflexivo Intuitivo verbal Secuencial
Civil 22 M Reflexivo Intuitivo verbal Secuencial
Civil 22 M Activo Intuitivo verbal Secuencial
Industrial 21 M Reflexivo Intuitivo verbal Global
Mecánica 19 M Reflexivo Intuitivo verbal Global
Agrimensura 20 M Reflexivo Sensorial Visual Secuencial
Química 22 F Activo Intuitivo verbal Secuencial
Química 18 F Reflexivo Sensorial verbal Secuencial
Industrial 20 M Reflexivo Intuitivo ? Global
Industrial 21 F Activo Intuitivo Visual Secuencial
Química 20 M Reflexivo Intuitivo verbal Secuencial
Química 18 M Reflexivo Intuitivo verbal Global
Química 19 F Activo Intuitivo verbal Secuencial
Industrial 21 F Reflexivo Intuitivo Visual Global
Alimentos 20 M Reflexivo Sensorial verbal Secuencial


Química 20 F Activo Intuitivo ? Global
Electricista 29 M Reflexivo Intuitivo verbal Secuencial
Mecánica 23 M Reflexivo ? Visual ?
Agrimensura 24 M Reflexivo Intuitivo Visual Global
Naval 20 M Reflexivo Intuitivo Visual Global
Química 18 M Reflexivo Intuitivo Visual Secuencial
Alimentos 20 F Activo Sensorial ? Global
Tabla A.4: Cuarto grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con los
A.2.1.5 – Quinto Grupo

Computación pertenecientes al quinto grupo de cuatro preguntas de la planilla. Éstos se

Carrera Edad Sexo
Naval 20 M Reflexivo Sensorial Visual Secuencial
Industrial 23 F Reflexivo Sensorial Verbal Secuencial
Civil 19 F Reflexivo Intuitivo Visual Secuencial
Electricista 24 M Reflexivo Intuitivo Visual Secuencial
Química 18 M Activo ? Visual Secuencial
Civil 19 M Reflexivo Intuitivo Verbal Secuencial


Industrial 20 M Reflexivo ? ? ?
Industrial 21 F Activo Sensorial ? Global
Química 20 M Activo ? Verbal Secuencial
Química 18 M Reflexivo Sensorial Verbal Global
Alimentos 20 M Reflexivo Sensorial Visual Secuencial
Química 21 F Reflexivo Intuitivo ? Secuencial
Química 20 F Reflexivo Sensorial ? Secuencial
Electricista 29 M Reflexivo Sensorial Visual Secuencial
Agrimensura 24 M Reflexivo Sensorial Visual Global
Naval 20 M Reflexivo Intuitivo Visual Secuencial
Alimentos 20 F Reflexivo Sensorial Verbal Secuencial
Tabla A.5: Quinto grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con los
A.2.1.6 – Sexto Grupo

Computación pertenecientes al sexto grupo de cuatro preguntas de la planilla. Éstos se

Carrera Edad Sexo
Civil 20 M ? Intuitivo Visual Secuencial
Civil 19 F Activo Intuitivo Visual Secuencial
Química 18 M Reflexivo Intuitivo Visual Global


Química 18 F Reflexivo Intuitivo Verbal Global
Industrial 20 M ? Sensorial Verbal Secuencial
Industrial 21 F Activo Sensorial ? Global
Industrial 21 M Activo ? Visual Secuencial
Alimentos 20 M Activo Sensorial Visual Secuencial
Química 21 F ? Intuitivo Visual Secuencial
Química 20 F ? ? Visual Secuencial
Electricista 29 M Reflexivo Sensorial Visual Secuencial
Alimentos 20 F Activo Intuitivo Verbal Secuencial
Tabla A.6: Sexto grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con los
A.2.1.7 – Séptimo Grupo

Computación pertenecientes al séptimo grupo de cuatro preguntas de la planilla. Éstos


Carrera Edad Sexo
Civil 20 M Activo Intuitivo ? Global
Industrial 21 M Activo Intuitivo Verbal Global
Civil 19 F Activo Intuitivo Verbal Global
Electricista 24 M Activo Intuitivo Verbal Global
Industrial 22 M Activo Sensorial ? Global
Industrial 21 M Reflexivo Intuitivo Verbal Global
Mecánica 19 M Reflexivo Intuitivo Verbal Global
Química 18 F Reflexivo Sensorial Verbal Secuencial
Industrial 20 M Reflexivo Intuitivo ? Global
Industrial 21 F Activo Intuitivo Verbal Global
Alimentos 20 M Activo Intuitivo Visual Global
Química 20 F Activo ? ? Global
Agrimensura 24 M Activo Intuitivo Visual Global

Naval 20 M Reflexivo Sensorial Verbal Global

Alimentos 20 F Reflexivo Sensorial Verbal Global
Tabla A.7: Séptimo grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con
A.2.1.8 – Octavo Grupo

Computación pertenecientes al octavo grupo de cuatro preguntas de la planilla. Éstos se

Carrera Edad Sexo
Civil 19 F Reflexivo Sensorial Verbal Secuencial
Electricista 24 M Reflexivo Sensorial Verbal Secuencial
Civil 21 M Activo Sensorial ? Global
Química 21 M Reflexivo Sensorial Verbal Global
Mecánica 19 M Activo Sensorial Verbal Global
Industrial 20 M Activo ? Visual ?

Industrial 21 M Activo ? Visual Global

Mecánica 27 M Reflexivo Sensorial Verbal Secuencial
Industrial 21 F Activo Intuitivo Visual Global
Alimentos 20 M Reflexivo Intuitivo Visual Global
Química 20 F ? Intuitivo ? Secuencial
Agrimensura 24 M Activo Sensorial Visual Global
Alimentos 20 F Activo Intuitivo Verbal Global
Tabla A.8: Octavo grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con los
A.2.1.9 – Noveno Grupo

Computación pertenecientes al noveno grupo de cuatro preguntas de la planilla. Éstos se

Carrera Edad Sexo
Naval 20 M Activo Intuitivo Visual Secuencial
Industrial 23 F Activo Sensorial Verbal Global
Civil 19 F Activo Intuitivo Verbal ?
Química 19 F Activo Intuitivo Verbal Secuencial


Industrial 20 M Reflexivo ? ? Global
Industrial 21 F Reflexivo Intuitivo Verbal Global
Química 20 M Activo ? Verbal Global
Mecánica 23 M Activo Sensorial Verbal Secuencial
Industrial 21 F Reflexivo Intuitivo Verbal Secuencial
Alimentos 20 M Activo Sensorial Verbal Global
Mecánica 23 M Activo Intuitivo ? Global
Agrimensura 24 M Reflexivo Intuitivo Visual Global
Naval 20 M Reflexivo Sensorial Verbal Secuencial
Naval 22 M Reflexivo Intuitivo Visual Global
Alimentos 20 F Activo Sensorial Verbal Global
Tabla A.9: Noveno grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con
A.2.1.10 – Décimo Grupo

Computación pertenecientes al décimo grupo de cuatro preguntas de la planilla. Éstos se

Carrera Edad Sexo
Civil 19 F ? ? ? Secuencial


Civil 21 M Reflexivo ? Visual Secuencial
Civil 22 M Reflexivo Sensorial ? Secuencial
Agrimensura 20 M Reflexivo Sensorial Verbal Global
Industrial 19 M Activo Sensorial ? Global
Industrial 20 M ? Sensorial Verbal ?
Industrial 21 F Activo Sensorial Verbal Secuencial
Mecánica 27 M Activo Sensorial ? Secuencial
Química 20 M Reflexivo ? Verbal ?
Alimentos 20 M Activo Sensorial Visual Global
Química 20 F Reflexivo Sensorial ? Secuencial
Mecánica 23 M Reflexivo ? Verbal Global
Agrimensura 24 M Reflexivo ? Verbal Secuencial
Mecánica 24 M Activo Intuitivo Verbal Secuencial
Alimentos 20 F Reflexivo Sensorial Visual Global
Tabla A.10: Décimo grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con

A.2.1.11 – Undécimo Grupo

Computación pertenecientes al undécimo grupo de cuatro preguntas de la planilla. Éstos

Carrera Edad Sexo
Industrial 23 F Reflexivo Sensorial Verbal Secuencial
Civil 19 F Reflexivo Intuitivo Visual Global
Industrial 20 M ? Intuitivo Visual Secuencial
Industrial 21 F Activo Intuitivo Visual Global
Industrial 21 F Activo Intuitivo Verbal Secuencial
Alimentos 20 M Activo Sensorial Visual Secuencial


Mecánica 24 M ? Sensorial Visual Secuencial
Alimentos 20 F Activo Sensorial Verbal Secuencial
Tabla A.11: Undécimo grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje,
con los datos de la carrera, el sexo y la edad del estudiante.
A.2.2 – Datos Obtenidos de la Materia Algoritmos y Programación I
Se presentarán los datos obtenidos de las planillas de estilos de aprendizajes

correspondientes a los alumnos de la materia Algoritmos y Programación I de la
Facultad de Ingeniería de la Universidad de Buenos Aires, materia incluida dentro del
área de Programación Básica.
A.2.2.1 – Primer Grupo

Algoritmos y Programación I pertenecientes al primer grupo de cuatro preguntas de la
planilla. Éstos se pueden ver en la Tabla A.12

Carrera Edad Sexo
Informática 20 M Activo Sensorial Visual Global
Informática 19 M Activo Sensorial Verbal Secuencial
Informática 20 M Activo Intuitivo Verbal Global
Sistemas 22 F Activo Sensorial Visual Secuencial
Informática 20 F Activo Sensorial Visual Global
Informática 19 M Reflexivo Sensorial Visual Secuencial
Sistemas 19 M Activo Sensorial Visual Global
Informática 19 M Activo Intuitivo Visual Secuencial
Sistemas 19 M Activo Sensorial Verbal Secuencial
Informática 19 M Activo Intuitivo Visual Global
Informática 20 M Reflexivo Sensorial Visual Global
Informática 18 M Activo Sensorial Verbal ?
Informática 20 M Activo ? Verbal Global
Sistemas 20 M Activo Intuitivo Verbal Secuencial
Sistemas 25 F Activo Intuitivo Visual Global
Sistemas 21 M Reflexivo Intuitivo Visual Global
Informática 19 F Reflexivo Intuitivo Visual Global
Sistemas 28 F Reflexivo Intuitivo Visual Global


Informática 18 F Activo Intuitivo Visual Secuencial
Sistemas 19 M Activo Sensorial Verbal Global
Sistemas 21 M Activo Intuitivo Visual Global
Informática 19 F Reflexivo Intuitivo Verbal Global
Informática 20 F Activo Intuitivo Visual Global
Informática 20 M Activo Sensorial Verbal Global
Sistemas 19 M Reflexivo Sensorial Visual Global
Tabla A.12: Primer grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con
A.2.2.2 – Segundo Grupo

Algoritmos y Programación I pertenecientes al segundo grupo de cuatro preguntas de la

Carrera Edad Sexo
Informática 20 M Reflexivo Intuitivo Visual Secuencial
Informática 19 M Reflexivo Sensorial Verbal Secuencial
Informática 19 M Reflexivo Sensorial Verbal Global
Sistemas 22 F Activo Intuitivo Verbal Global
Informática 19 M Activo Sensorial Visual Secuencial
Sistemas 19 M Reflexivo Sensorial Verbal Secuencial
Informática 19 M Reflexivo Intuitivo Visual Global
Informática 18 M Reflexivo Intuitivo Verbal Global
Sistemas 21 M Reflexivo Sensorial Visual Global
Informática 19 F Activo Sensorial Visual Secuencial
Sistemas 28 F Activo Sensorial Visual Global
Sistemas 19 M Reflexivo Sensorial Verbal Global
Informática 18 F Reflexivo Sensorial Visual Global
Informática 19 F Activo Sensorial Verbal Global
Informática 19 M Reflexivo Sensorial Visual ?
Informática 18 F Reflexivo Sensorial Visual Secuencial
Sistemas 19 M Reflexivo Sensorial Visual Secuencial
Sistemas 21 M Reflexivo Intuitivo Verbal Secuencial
Informática 19 F Activo Intuitivo Verbal Secuencial


Tabla A.13: Segundo grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con
A.2.2.3 – Tercer Grupo
En la Tabla A.14 se transcriben los datos relevados de los alumnos de la materia

Algoritmos y Programación I pertenecientes al tercer grupo de cuatro preguntas.

Carrera Edad Sexo
Sistemas 19 M ? Sensorial Verbal Global
Sistemas 19 M Activo Sensorial Visual Secuencial
Informática 20 M Activo Intuitivo Verbal Secuencial
Sistemas 25 F Activo Intuitivo Visual Secuencial
Informática 18 F Activo Sensorial Verbal Secuencial
Informática 19 F Activo Sensorial Verbal Secuencial
Sistemas 19 M Reflexivo Intuitivo Visual Secuencial
Tabla A.14: Tercer grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con

A.2.2.4 – Cuarto Grupo
Se transcriben los datos relevados de los alumnos de la materia Algoritmos y

Programación I pertenecientes al cuarto grupo de cuatro preguntas de la planilla. Éstos

Carrera Edad Sexo
Informática 19 M Reflexivo Intuitivo Verbal Secuencial
Sistemas 22 F Reflexivo Sensorial Visual Secuencial
Informática 20 F Reflexivo Intuitivo Visual Secuencial
Sistemas 19 M Activo Sensorial Verbal ?
Sistemas 28 F Reflexivo Intuitivo Visual Secuencial
Informática 18 F Activo Intuitivo ? Secuencial
Tabla A.15: Cuarto grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con

A.2.2.5 – Quinto Grupo

Programación I pertenecientes al quinto grupo de cuatro preguntas de la planilla. Éstos

Carrera Edad Sexo
Sistemas 22 F Reflexivo Intuitivo Verbal Global
Sistemas 19 M Activo Intuitivo Visual Secuencial
Informática 20 M Activo ? Visual ?
Informática 18 F Reflexivo Sensorial Visual ?
Informática 19 F Reflexivo Sensorial Verbal Secuencial
Sistemas 20 F Reflexivo Sensorial Visual Global
Tabla A.16: Quinto grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con

A.2.2.6 – Sexto Grupo

Programación I pertenecientes al sexto grupo de cuatro preguntas de la planilla. Éstos se

Carrera Edad Sexo
Sistemas 22 F Activo Intuitivo Verbal Secuencial
Informática 20 M ? ? ? ?
Sistemas 21 M Activo Intuitivo Visual Secuencial
Informática 18 F ? ? ? ?
Tabla A.17: Sexto grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con los

A.2.2.7 – Séptimo Grupo

Algoritmos y Programación I pertenecientes al séptimo grupo de cuatro preguntas de la

Carrera Edad Sexo
Sistemas 19 M Activo ? Verbal Secuencial
Informática 20 M Reflexivo Intuitivo ? Global
Informática 20 M ? Intuitivo Visual Global
Sistemas 21 M Reflexivo Intuitivo Verbal Global
Informática 18 F ? ? ? Global
Sistemas 20 F Reflexivo Intuitivo Verbal Global
Tabla A.18: Séptimo grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con

A.2.2.8 – Octavo Grupo

Algoritmos y Programación I pertenecientes al octavo grupo de cuatro preguntas de la

Carrera Edad Sexo
Sistemas 22 F Reflexivo Sensorial Verbal Secuencial
Informática 20 M ? ? Verbal Secuencial
Sistemas 25 F Reflexivo Intuitivo Visual Secuencial
Informática 18 F Activo Intuitivo Verbal Global
Informática 19 F Reflexivo Sensorial Verbal Global
Tabla A.19: Octavo grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con

A.2.2.9 – Noveno Grupo

Algoritmos y Programación I pertenecientes al noveno grupo de cuatro preguntas de la

Carrera Edad Sexo
Sistemas 22 F Reflexivo Intuitivo Verbal Secuencial
Informática 20 F Activo Sensorial Verbal Global
Informática 20 M Reflexivo Sensorial ? Secuencial
Sistemas 20 M Activo Intuitivo Verbal Global
Informática 19 F Activo Intuitivo Verbal Global
Informática 19 F Reflexivo Intuitivo Verbal Secuencial
Tabla A.20: Noveno grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con

A.2.2.10 – Décimo Grupo

Algoritmos y Programación I pertenecientes al décimo grupo de cuatro preguntas de la

Carrera Edad Sexo
Sistemas 19 M Reflexivo ? Visual Global
Informática 20 M ? Intuitivo Visual Secuencial
Informática 18 M Reflexivo ? Visual Secuencial
Sistemas 25 F Reflexivo Intuitivo Verbal Secuencial
Sistemas 21 M Reflexivo Intuitivo ? Secuencial
Informática 19 F Reflexivo Intuitivo Verbal Secuencial
Tabla A.21: Décimo grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje, con

A.2.2.11 – Undécimo Grupo

Algoritmos y Programación I pertenecientes al undécimo grupo de cuatro preguntas de
la planilla. Éstos se pueden ver en la Tabla A.22

Carrera Edad Sexo
Sistemas 28 F Activo Intuitivo Verbal Secuencial
Tabla A.22: Undécimo grupo de preguntas relevadas a partir de las planillas de estilos de aprendizaje,
con los datos de la carrera, el sexo y la edad del estudiante.

A.3 – Valores de Entrenamiento para la Red S.O.M.
A.3.1 – Datos Codificados
Como se mencionó en la sección 2.2.4 – Redes Self Organizing Maps (S.O.M.), los
datos de entrada para las redes neuronales del tipo Self Organizing Maps (S.O.M.) sólo
pueden ser numéricos, tanto reales como enteros. A continuación se presentan los datos
de la sección A.2- Planillas de estilos de Aprendizaje, pero esta vez se los muestra
codificados como se usaron para entrenar la red. La codificación de estos datos puede
encontrarse en la sección 5.2.2 –Codificación de los Datos Relevados del Capitulo 5. En
la Tabla A.23 se muestran los datos relevados codificados para las 121 planillas, sin
discriminar la materia a la que pertenecen (aunque esta discriminación se puede realizar
fácilmente utilizando el atributo carrera).
Grupo Grupo Grupo Grupo Grupo Grupo Grupo Grupo Grupo Grupo Grupo
1 2 3 4 5 6 7 8 9 10 11
Carrera
Edad
Sexo
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1 20 0 0 1 0 1 2 0 2 0 0 0 0 0 0 0 0 1 1 0 0 0 2 1 0 0 0 1 2 1 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0
2 20 0 0 1 0 1 1 0 0 1 0 1 2 0 0 0 0 0 1 0 0 0 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 0 1 0 0 0 0 0 0 0
3 20 0 0 1 1 1 0 1 0 1 0 0 0 0 1 1 0 0 1 1 1 0 1 0 0 1 0 1 1 1 1 0 0 0 1 0 1 1 1 0 1 0 1 1 0 0
4 21 0 0 0 0 1 0 1 1 0 1 1 1 0 1 1 0 1 0 1 0 0 1 0 0 0 0 1 1 1 0 0 1 1 0 0 1 0 0 0 0 0 0 0 0 1
5 20 1 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 1 1 0
4 24 0 0 1 1 0 0 1 0 0 0 0 1 0 1 1 1 0 1 1 1 0 1 0 1 0 1 1 1 0 1 0 1 1 0 0 1 0 0 0 0 0 0 1 1 0
4 23 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 1 1 0 1 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 1 1 1 0 0 1 1 0 1 0
5 19 1 0 1 0 1 0 0 0 1 0 0 0 1 1 1 0 0 1 0 0 0 0 0 0 0 1 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 19 1 0 1 0 1 0 0 0 1 0 1 1 0 1 1 1 0 1 1 0 0 0 1 0 0 0 1 1 1 1 0 1 0 0 1 1 2 2 2 2 0 1 1 0 1
6 24 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 0 1 1 0 0 0 1 0 1 0 1 1 1 1 0 1 0 0 1 1 1 0 0 0 0 0 1 0 1
4 22 0 0 0 0 0 1 0 1 1 0 0 0 0 1 1 0 1 1 1 0 0 0 1 0 1 0 1 0 1 1 0 1 0 0 1 1 1 1 0 0 0 0 0 0 1
1 21 0 0 1 2 0 0 0 0 1 1 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0 1 1 0 1
4 20 0 0 1 0 0 0 1 0 0 0 1 0 1 1 0 1 1 1 0 0 1 1 0 1 0 1 0 0 0 1 0 0 1 0 1 1 0 0 0 1 1 1 0 1
5 18 0 1 0 0 1 1 1 1 1 0 1 0 0 1 1 1 1 1 0 0 1 1 1 0 1 1 1 0 1 1 1 1 0 1 1 0 1 0 1 1 0 1 0 0 1
5 29 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 1 1 0 0 0 1 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
4 19 0 0 0 1 1 0 0 1 1 0 0 1 0 1 1 0 1 1 0 1 0 1 0 0 0 1 0 1 1 0 0 0 1 1 0 1 1 1 0 0 0 1 1 0 0
5 18 0 0 0 0 1 0 1 0 0 0 1 0 1 0 1 0 1 0 2 0 0 1 1 0 1 0 0 0 1 1 0 0 0 1 0 0 0 0 0 1 1 1 1 0 0
4 19 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 1 0 0 0 0 1 1 0 1 0 1 0 1 1 1 1 0 0 1 1 0 0 0
4 20 0 0 0 0 1 1 1 1 0 0 1 0 0 1 0 0 1 1 0 1 0 1 0 1 0 0 0 0 1 1 1 1 0 0 1 1 1 1 0 1 0 1 1 0 0
4 20 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 0 0 0 1 0 0
4 19 0 1 0 0 0 1 1 1 0 0 1 1 0 0 1 0 0 1 1 1 0 0 0 1 1 0 1 1 1 0 1 1 0 0 1 1 1 0 1 0 0 0 0 0 0
1 19 0 0 0 0 1 0 0 0 1 0 1 0 0 1 1 0 1 1 1 0 1 1 0 1 0 0 1 0 1 1 1 1 0 1 1 1 1 1 0 1 0 1 1 0 0
1 19 0 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0
1 20 0 0 0 0 0 0 0 0 0 0 2 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 1 0 1
5 21 0 0 0 1 1 1 0 1 0 0 0 1 0 1 0 0 0 1 0 1 0 1 0 1 0 1 1 1 1 1 0 0 1 0 1 1 0 1 0 1 0 0 1 1 0
1 21 0 1 0 0 1 1 1 1 1 0 1 0 1 1 1 1 1 1 1 0 0 1 0 0 0 0 1 0 1 0 0 2 1 1 0 0 1 1 2 0 0 0 0 0 0
4 20 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 1 1 1 1 1 0 1 0 1 1 1 0 0 0 0 0 1 0 1
4 21 0 0 1 0 1 1 0 1 1 0 0 1 0 0 1 0 1 1 1 0 0 1 0 0 0 0 1 0 0 1 0 1 1 0 1 1 1 0 1 1 1 0 1 0 1
5 19 1 0 0 0 1 0 1 1 1 0 1 0 0 1 1 0 0 1 1 0 0 1 0 0 0 0 1 1 1 0 0 1 0 0 1 1 0 0 0 1 1 0 1 1 1
5 21 0 1 1 1 1 1 0 1 0 0 1 1 0 1 1 1 0 1 1 1 0 1 1 0 0 0 1 1 0 1 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0
4 22 0 0 0 0 0 1 0 1 0 0 1 0 1 1 0 0 0 0 1 0 0 1 0 1 0 0 0 2 1 0 0 1 1 1 0 1 1 0 0 0 0 1 0 0 0
1 22 0 0 0 0 1 1 0 1 0 0 1 2 0 1 1 1 0 1 0 0 0 1 0 1 0 0 1 0 1 0 0 0 1 1 0 1 0 1 0 2 0 0 0 0 1
4 19 0 0 1 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0
1 22 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 1 1 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0

4 20 0 0 0 0 1 1 1 0 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0 0 1 0 0 1 1 0 0 0 0 0 0 0
4 21 0 1 1 0 1 0 0 0 1 0 0 0 1 1 1 1 1 1 0 0 1 0 1 0 1 1 1 1 1 0 1 0 0 1 1 1 0 1 0 1 1 0 0 0 0
3 19 0 1 1 0 1 1 0 0 1 1 1 1 0 1 1 1 1 1 1 0 0 1 0 0 0 1 1 1 1 0 0 1 1 1 1 1 0 1 1 1 1 0 0 0 0
4 19 0 0 0 0 1 1 0 0 0 1 0 0 0 1 1 0 0 1 0 0 0 0 1 0 1 1 1 0 1 1 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0
1 20 0 0 0 1 0 1 0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0
4 21 0 0 0 1 0 1 0 1 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 1 0 1 1 1 0 0 1 0 1 0 0 0 0 0 0 0
7 20 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 1 1 0 0 0 0
4 21 0 0 0 0 1 1 0 0 1 0 1 0 0 1 1 0 0 1 0 0 0 1 0 0 0 1 0 1 1 1 0 0 0 1 0 1 0 0 1 0 1 0 1 0 0
5 22 1 0 1 0 0 0 1 1 1 0 1 0 0 0 1 1 0 1 1 0 0 0 1 0 1 0 1 0 1 1 0 0 0 1 1 0 1 0 0 1 0 0 0 0 1
5 18 1 0 1 0 0 0 1 0 0 1 1 1 1 1 0 1 0 1 1 0 0 1 1 1 1 1 0 1 0 0 0 1 0 0 1 1 0 1 1 0 1 0 0 1 0
4 19 0 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 1 0 0 0 0 1 0 0 0 0
4 20 0 0 0 0 1 0 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 1 1 0 0 0 1 1 0 0 1 1 0 0 0 0 1 0 0
4 19 0 2 0 0 1 1 0 0 1 0 1 0 0 1 1 0 1 1 0 1 1 1 0 0 1 0 1 1 1 1 0 0 1 1 0 0 0 0 0 2 1 0 1 0 1
4 20 0 2 2 2 1 2 0 0 2 2 2 0 0 1 1 2 1 1 2 2 2 2 0 1 0 1 1 2 1 0 2 0 2 1 2 2 1 2 0 1 2 2 1 0 0
4 21 1 0 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 0 0 2 1 0 0 2 1 0 1 1 1 0 1 0 0 1 1 1 1 0 0 1 0 0 1 0 1
4 21 0 0 1 0 1 0 0 0 1 0 1 0 2 0 0 0 0 1 0 0 0 0 2 0 0 0 1 0 1 0 2 0 1 0 1 0 0 0 0 0 1 0 1 0 0
5 20 1 0 0 0 1 1 0 1 1 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 1 1 1 0 0 0 1 0 1 0 0 0 0 0
3 27 0 0 0 0 1 1 0 1 1 1 0 0 0 1 1 0 1 1 1 0 0 0 0 0 0 1 1 0 1 1 0 1 0 0 1 1 1 0 0 2 0 1 0 0 0
5 20 1 1 0 0 1 0 0 1 1 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 1 0 1 0 0 0 1 1 0 0 0 0 1 0 0
5 20 0 1 0 2 1 1 1 1 1 1 1 1 0 1 1 1 0 0 2 1 0 0 1 0 1 1 1 1 1 0 1 1 0 0 2 1 1 1 2 1 2 0 1 0 0
5 18 0 0 0 0 1 0 0 1 1 0 1 0 0 1 1 1 1 1 0 1 1 0 1 1 0 1 1 0 1 0 1 0 1 1 1 0 1 0 0 0 0 0 1 0 1
3 23 0 0 0 0 1 1 1 0 1 1 1 0 0 1 0 0 0 1 1 0 0 1 0 0 0 1 1 1 1 1 0 1 1 0 0 1 0 1 1 0 0 1 0 1 0
5 19 1 0 0 0 1 0 0 1 1 0 0 1 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 1 1 1 0 1 0 0 0 1 0 0 1 1 0
4 21 1 0 0 0 1 1 0 0 1 0 0 0 0 1 1 0 1 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 1 1 1 1 0 1 0 0 0 0 1 1 0
3 23 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 1 0 0 0 1 1 1 1 1 0 0 0 1 0 0 0 0
8 20 0 0 1 0 1 1 0 1 1 0 1 0 0 1 0 1 0 1 0 0 0 0 0 0 0 0 1 0 1 1 1 0 1 0 0 1 1 0 0 0 1 0 0 0 0
1 20 0 1 0 0 1 0 1 1 1 0 0 1 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 1 1 0 1 1 1 1 0 0 0 1 1 0 0 0
3 24 0 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 1 0 0 0 1 0 1 0 1 0 0 0 1 1 1 1 0 0 1 0 0 0 1
3 20 0 0 1 1 0 0 0 0 1 1 0 0 0 1 1 0 0 1 0 0 0 1 0 0 0 1 1 0 1 1 0 0 1 0 1 1 1 1 0 0 1 1 0 1 0
5 21 1 0 1 0 1 0 0 0 1 0 1 0 0 1 1 0 0 1 1 2 0 2 1 0 0 1 1 0 1 1 0 0 0 0 1 1 0 0 0 1 1 0 0 1 0
5 20 1 1 0 0 1 1 0 0 1 0 2 0 0 0 1 2 1 1 0 2 0 2 2 0 0 0 2 2 1 2 1 2 0 0 1 0 1 1 0 2 0 0 1 0 1
6 29 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 0 0 0 1 0 0 0 0 1 1 1 1 0 1 1 1 0 1 0 1 0 1 0 0 0 0 0
3 23 0 0 1 0 1 1 0 0 1 1 0 0 0 1 2 0 2 0 0 0 1 1 1 0 0 0 0 0 1 0 1 0 0 0 1 2 1 1 2 1 1 0 0 0 1
7 24 0 0 0 1 0 0 0 0 0 0 1 1 1 1 1 0 1 1 0 0 1 1 0 0 0 0 1 0 1 0 0 0 1 1 1 0 1 1 2 1 0 1 0 0 0
2 20 0 1 0 0 1 1 0 1 1 0 1 0 0 1 1 0 1 1 1 0 0 1 0 0 0 1 0 1 1 1 0 0 1 1 0 1 0 1 0 0 0 1 0 0 1
2 22 0 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 1 1 0 0 1 0 1 0 1 0 1 0 1 0 1 0 1 1 1 0 1 0 0 0 0 0 1 0 1
4 20 0 2 0 0 1 2 0 0 1 0 0 2 0 1 0 0 1 1 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 1 0 0 1 1 0 1 1 0 1 0 1
3 24 0 1 2 0 1 1 1 0 1 0 1 0 0 1 1 0 1 1 1 0 0 1 0 0 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 1 0 2 0 0 0
5 18 0 0 1 0 1 1 0 0 0 0 0 0 1 1 1 0 0 1 1 0 0 1 1 0 1 0 1 0 1 1 1 1 1 0 1 1 0 1 1 1 1 0 1 1 0
8 20 1 0 1 0 1 2 0 0 1 0 1 0 0 0 0 2 1 1 0 1 0 0 1 1 0 1 0 1 1 0 1 1 1 0 0 1 1 1 0 0 1 0 0 1 0
0 20 0 0 0 0 1 1 1 0 0 1 1 1 1 1 0 1 0 1 0 0 0 0 0 1 0 1 1 0 1 0 1 0 0 1 0 0 1 1 0 0 0 0 0 0 0
0 19 0 0 0 1 0 1 0 1 0 0 0 0 0 0 1 1 0 1 0 0 0 1 0 1 0 1 0 0 0 1 0 1 0 1 0 1 0 1 0 0 1 1 0 1 0
0 20 0 0 1 1 1 0 0 1 1 0 0 1 1 1 1 1 1 1 1 1 0 0 1 0 1 0 1 1 1 1 0 0 0 0 1 1 0 0 1 0 1 1 1 1 0
0 19 0 0 0 0 1 1 0 1 1 0 0 0 1 1 1 1 0 1 0 0 0 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 0 0 1 0 1 1 0 1
9 22 1 0 0 0 0 0 1 1 1 0 0 0 1 1 0 0 0 1 1 1 1 0 1 1 0 1 0 0 0 1 0 1 0 1 1 1 0 1 0 1 0 1 0 0 0
0 20 1 0 0 0 1 0 0 0 1 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1 1 1 0 0 0 0 1 0 0
0 19 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 1 0 0
9 19 0 0 0 0 1 0 0 1 0 2 0 1 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 1 1 1 1 0 0 0 0 0 1 0 0 0 0
0 20 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
0 19 0 0 1 0 0 0 0 1 0 0 1 0 0 1 0 0 1 1 0 0 0 1 1 0 1 1 0 0 0 1 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0
9 19 0 0 0 1 0 1 0 1 0 0 0 0 0 0 0 1 2 1 1 0 0 1 0 1 0 0 2 1 0 1 1 1 0 1 0 1 1 1 2 0 1 1 1 0 0
0 18 0 0 1 0 0 1 1 0 0 0 0 1 0 1 1 0 0 1 0 1 0 1 0 0 0 0 1 1 0 0 0 0 1 0 1 1 0 1 1 1 0 1 0 0 1
0 19 0 0 1 0 1 1 1 0 1 0 1 0 0 1 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0 1 1 0 0 1 1 0 0 1 1 1 0 1 0 1 1
0 20 0 0 1 0 1 1 1 0 1 0 1 1 0 1 0 0 1 1 0 0 0 1 1 0 0 1 1 2 1 1 1 0 1 1 1 1 1 2 1 0 0 1 1 0 0

0 20 0 1 0 0 1 1 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 1 1 1 0 0 1 1 0 1 0 1 0 0 0 1 0 0 0
0 18 0 0 0 1 2 1 1 1 1 1 0 0 0 1 0 1 1 1 0 0 0 1 0 0 0 1 0 0 1 0 1 0 1 0 0 0 0 1 2 0 0 0 0 1 0
0 18 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 1 1 0 0 1 1 0 0 1 1 1 0 1 0 0 1 1 1 1 1 0 1 0 0 1 0 0
0 20 0 0 2 1 1 1 1 1 1 1 0 0 1 1 1 0 1 0 2 0 2 1 0 0 0 2 1 0 1 2 2 1 0 1 0 2 0 1 1 0 0 0 1 0 0
9 20 0 0 1 1 0 0 0 1 1 0 0 1 0 1 1 1 0 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 0 1 1 1 1 0 0 0 1 0 0 0
9 25 1 0 1 0 1 0 1 0 1 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 1 0 1 1 1 0 0 1 1 0 1 1 1 1 0 0 1 0 0
9 21 0 1 1 0 1 1 0 0 1 0 1 0 1 0 0 1 0 1 0 0 0 0 1 0 0 1 1 1 1 0 0 0 0 1 1 0 1 0 1 0 1 0 0 0 1
0 19 1 1 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 1 0 1 1 1 0 1 0 1 1 1 0 0 0 0 1 0 0 0
9 28 1 1 1 0 1 0 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 1 0 0 1 1 0 1 1 0 1 0 0 1 1 0
0 20 0 0 1 1 1 1 0 0 1 0 1 0 0 1 0 1 1 1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 1
9 19 0 0 0 0 1 1 0 1 1 0 0 1 0 1 1 1 0 1 0 0 0 1 1 0 0 0 0 0 1 0 0 1 1 0 0 0 1 1 0 0 0 1 0 1 1
0 18 1 0 0 0 1 1 0 0 1 0 0 0 0 1 1 0 0 1 0 0 2 2 2 2 2 2 2 2 1 0 1 1 1 1 0 1 1 1 0 0 1 1 1 0 0
0 21 0 0 0 0 1 1 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 1 0 0 0 0 1 1 1 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0
0 19 1 1 1 0 1 0 0 1 1 0 1 1 0 0 1 1 0 1 0 1 0 0 0 0 0 1 1 1 1 1 0 1 1 0 1 1 0 1 1 0 0 1 0 0 0
0 19 0 0 0 0 1 1 0 0 2 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 1 0 1 1 0 1 0 0 0 1 0 1 0 0 0
0 21 0 0 1 0 0 1 0 0 0 0 1 0 0 1 1 0 1 1 0 0 0 1 1 0 1 1 0 0 1 0 1 0 1 0 0 0 0 0 0 0 1 1 0 0 0
0 19 0 1 0 0 1 1 0 1 1 1 1 1 1 1 1 0 1 0 0 0 0 1 0 0 1 0 1 0 1 1 0 1 1 1 0 0 1 1 0 0 0 1 0 0 1
9 20 1 0 1 0 1 0 1 0 1 0 0 0 0 1 1 0 1 1 0 0 1 0 0 0 1 1 1 1 1 0 0 0 1 1 1 0 1 1 1 0 1 1 0 0 0
0 18 1 0 1 0 0 1 0 0 0 0 0 1 0 0 1 2 0 1 0 0 0 1 0 0 0 1 1 1 1 1 0 1 1 1 0 1 0 0 0 0 1 0 0 0 0
9 19 0 0 0 1 1 1 0 0 0 1 0 1 0 1 1 0 0 1 0 0 0 1 0 0 0 0 0 1 1 0 0 0 1 1 0 1 0 1 0 1 1 1 0 0 0
9 21 0 0 1 0 1 1 1 1 0 0 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 1 0 1 1 0 1 0 1 1 0 1 0 1 1 2 0 0 1 0 1
0 19 0 0 1 0 1 1 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 1 1 0 0 0 0 0 0 1 0 1 0 0 0 1 1 1 0
0 21 0 0 1 0 0 1 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0 1 1 0 0 0 0
0 19 1 1 1 1 1 0 1 1 0 0 0 1 0 1 1 0 0 1 0 0 0 1 0 0 0 1 1 1 1 1 0 1 1 1 1 1 0 1 1 0 0 1 0 0 0
0 20 0 0 1 0 1 1 0 0 1 0 1 0 0 1 1 0 0 1 1 1 0 0 1 0 0 0 1 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 1 0 0
0 20 0 0 0 0 1 0 0 0 1 1 0 0 1 0 1 0 0 0 0 0 0 1 0 0 1 0 1 1 0 1 0 0 0 1 0 1 0 1 0 0 1 0 1 0 1
0 21 0 0 1 0 1 1 0 0 0 0 0 0 0 1 1 0 1 1 1 0 0 1 1 0 0 1 1 0 1 1 1 0 0 1 0 0 1 1 0 0 0 0 1 1 0
0 20 1 0 1 0 1 1 0 0 0 0 0 0 1 1 1 0 0 1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 1 1 0 1 0 1 0 0 1 1 0 0 0
0 20 0 0 0 1 1 1 0 1 0 0 1 1 0 0 1 0 1 1 1 0 0 1 1 0 0 0 1 0 1 0 0 1 1 0 1 0 1 1 0 1 0 0 0 0 0
0 19 0 1 0 0 1 1 0 1 1 0 1 0 0 1 1 0 0 0 0 0 0 0 1 1 0 1 0 0 1 0 1 0 1 0 1 1 0 0 0 0 1 0 1 0 0
0 19 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 1 1 0 0 0 1 0 1 0 0 1 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0
0 19 1 1 1 0 1 0 1 0 1 1 0 0 0 1 1 0 1 1 1 0 0 1 1 0 0 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 0 1 0 0
9 19 0 1 0 0 1 1 1 0 1 1 1 0 0 1 0 0 0 1 1 0 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 1 1 1 1 0 1 0 0 0
Tabla A.23: Datos codificados de las 121 instancias relevadas de la planilla de estilos de aprendizaje. La
codificación utilizada se puede ver en la sección 5.3.1 Codificación del Capítulo 5.
A.3.2 – Clusters Resultantes
Luego del aprendizaje automático realizado por la red S.O.M. con los datos presentados
en la sección A.3.1.- Datos Codificados de este Anexo, se presentan nuevamente los
juegos de datos en las entradas de la red S.O.M. para que ésta los clasifique en familias
o clusters de acuerdo a la información adquirida durante el periodo de entrenamiento
automático. Como el proceso de aprendizaje es del tipo “Winner takes All” sólo se
activará una neurona de salida, correspondiente a un cluster para cada juego de datos
presentado a la entrada de la red, por lo tanto, cada observación será categorizada con
un solo cluster según la red S.O.M. entrenada.
Los juegos de datos que se utilizan para entrenar la red son procesados con el atributo
edad y sin éste. La clasificación resultante de aplicar las redes S.O.M. se encuentra, para
los primeros se en la Tabla A.26 de la sección A.3.3.1.- Observaciones Clasificadas
(Red entrenada con el atributo Edad), mientras que para los segundos se encuentran en
la Tabla A.27 de la sección A.3.3.2.- Observaciones Clasificadas (Red entrenada sin el
atributo Edad).

Se presentan a continuación las 121 observaciones clasificadas por la red S.O.M. una
vez entrenada con los parámetros óptimos.
Observación Cluster Observación Cluster

1 3 61 3
2 3 62 3
3 3 63 3
4 3 64 3
5 3 65 2
6 3 66 3
7 3 67 3
8 3 68 3
9 2 69 3
10 3 70 3
11 3 71 3
12 3 72 3
13 3 73 3
14 3 74 3
15 3 75 3
16 3 76 3
17 3 77 3
18 3 78 3
19 3 79 3
20 3 80 3
21 3 81 3
22 3 82 3
23 3 83 1
24 3 84 3
25 3 85 3
26 3 86 3
27 3 87 3
28 3 88 2
29 3 89 3
30 3 90 3
31 3 91 3
32 3 92 3
33 3 93 3
34 3 94 3
35 3 95 3
36 3 96 3
37 3 97 3
38 3 98 3
39 3 99 3
40 3 100 2
41 3 101 3
42 3 102 3
43 3 103 3
44 3 104 3
45 3 105 3
46 3 106 3
47 3 107 3

48 2 108 3
49 3 109 3
50 3 110 3
51 3 111 3
52 3 112 3
53 3 113 3
54 2 114 3
55 3 115 3
56 3 116 3
57 3 117 3
58 3 118 3
59 3 119 3
60 3 120 3
121 3
Tabla A.26: Resultado de aplicar las redes neuronales S.O.M. a los datos de entrada
A.3.3 – Valores Medios y Varianzas de los Clusters Resultantes
Una vez clasificadas las observaciones de las planillas de estilos de aprendizaje

relevadas por la red S.O.M. como se explica en la sección A.2.- Planillas de estilos de
aprendizaje de este mismo Anexo y obtenidos los resultados mencionados en la sección
A.3.3.- Clusters Resultantes se pueden realizar los análisis posteriores utilizando las
medias y las varianzas de cada uno de los clusters generados con respecto a los datos
normalizados.
Los valores medios de los distintos clusters discriminados por atributos se pueden ver
en la Tabla A.24, para los datos con todos los atributos, en la sección A.3.4.1.- Valores
Medios de los Clusters discriminados por atributos, mientras que los valores medios
para los clusters resultantes de los juegos de datos que no utilizaron todos los atributos
pueden verse en la Tabla A.25 de la misma sección. Las varianzas de los distintos
clusters discriminados por atributos se pueden ver en la Tabla A.26 donde la notación
que identifica a una pregunta determinada es “P” para denominar a las preguntas (que
van de 1 a 4 por grupo) y “G” para denominar al grupo (existen 11 grupos de cuatro
preguntas en las planillas de estilos de aprendizaje). Por lo tanto P1G1 será la pregunta
número uno del primer grupo de preguntas.
Valores Medios de los Clusters

Parámetro Promedio Cluster 1 Cluster 2
Carrera 3,2 2,5 3,3
Edad 20,4 19,5 20,5
Sexo 0,2 0,5 0,2
P1G1 0,2 0,7 0,2
P2G1 0,5 0,7 0,5
P3G1 0,2 0,7 0,2
P4G1 0,8 1,0 0,7
P1G2 0,6 1,0 0,6
P2G2 0,3 0,4 0,2
P3G2 0,4 0,2 0,4
P3G2 0,6 1,2 0,6
P1G3 0,2 0,5 0,2

P2G3 0,5 1,2 0,4

P3G3 0,4 0,5 0,4
P4G3 0,2 0,0 0,2
P1G4 0,7 0,8 0,7
P2G4 0,7 0,8 0,7
P3G4 0,3 1,0 0,3
P4G4 0,4 0,5 0,4
P1G5 0,8 0,8 0,9
P2G5 0,4 0,8 0,4
P3G5 0,3 0,8 0,2
P4G5 0,2 0,7 0,1
P1G6 0,6 1,2 0,6
P2G6 0,4 1,2 0,4
P3G6 0,2 0,5 0,2
P4G6 0,3 0,5 0,2
P1G7 0,5 0,8 0,4
P2G7 0,7 1,3 0,6
P3G7 0,5 1,7 0,4
P4G7 0,8 1,0 0,8
P1G8 0,5 0,7 0,5
P2G8 0,4 1,0 0,4
P3G8 0,4 0,8 0,4
P4G8 0,5 0,7 0,5
P1G9 0,5 0,5 0,5
P2G9 0,5 1,2 0,5
P3G9 0,7 1,0 0,6
P4G9 0,5 1,2 0,5
P1G10 0,7 1,5 0,6
P2G10 0,3 0,8 0,3
P3G10 0,5 1,0 0,4
P4G10 0,4 0,8 0,3
P1G11 0,4 0,8 0,4
P2G11 0,5 1,0 0,4
P3G11 0,2 0,0 0,2
P4G11 0,3 0,3 0,3
Tabla A.24: Valor medio de los 2 clusters generados para cada uno de los 47
valores recogidos por medio de la planilla de estilos de aprendizaje.
Valores Medios de los Clusters

Parámetro Promedio Cluster 1 Cluster 2
Carrera 3,2 2,1 3,3
Edad 0,2 0,4 0,2
P1G1 0,5 0,9 0,5
P2G1 0,2 0,7 0,2
P3G1 0,8 1,0 0,7
P4G1 0,6 1,0 0,6
P1G2 0,3 0,5 0,2
P2G2 0,4 0,3 0,4
P3G2 0,6 1,1 0,6
P3G2 0,2 0,6 0,2
P1G3 0,5 1,0 0,4
P2G3 0,4 0,4 0,4

P3G3 0,2 0,1 0,2
P4G3 0,7 0,9 0,7
P1G4 0,7 0,9 0,7
P2G4 0,3 0,9 0,3
P3G4 0,4 0,6 0,4
P4G4 0,8 0,7 0,9
P1G5 0,4 1,0 0,4
P2G5 0,3 0,7 0,2
P3G5 0,2 0,9 0,1
P4G5 0,6 1,1 0,6
P1G6 0,4 1,0 0,4
P2G6 0,2 0,4 0,2
P3G6 0,3 0,4 0,2
P4G6 0,5 1,0 0,4
P1G7 0,7 1,3 0,6
P2G7 0,5 1,4 0,4
P3G7 0,8 1,0 0,8
P4G7 0,5 0,9 0,4
P1G8 0,4 1,1 0,4
P2G8 0,4 0,9 0,4
P3G8 0,5 0,6 0,5
P4G8 0,5 0,6 0,5
P1G9 0,5 1,0 0,5
P2G9 0,7 1,1 0,6
P3G9 0,5 1,0 0,5
P4G9 0,7 1,4 0,6
P1G10 0,3 0,9 0,3
P2G10 0,5 0,9 0,4
P3G10 0,4 0,7 0,3
P4G10 0,4 0,7 0,4
P1G11 0,5 1,0 0,4
P2G11 0,2 0,0 0,2
P3G11 0,3 0,3 0,3
P4G11 3,2 2,1 3,3
Tabla A.25: Valor medio de los 2 clusters generados para cada uno de los 47
valores recogidos por medio de la planilla de estilos de aprendizaje.
A.4 – Inducción y Árboles de Decisión.
A continuación se realiza el análisis de los distintos nodos de los árboles de decisión

generados por medio del algoritmo C4.5. Se analiza el soporte de cada uno de los nodos
(a través de las observaciones totales), la confianza de los nodos (a través de las
observaciones mal clasificadas) y se visualiza la distribución de la clase para cada uno
de los clusters generados por S.O.M.
A.4.1 – Análisis del Árbol generado
Se presenta el resumen de las características de los nodos generados por el algoritmo

C4.5 para el conjunto de entrenamiento resultante de la concatenación de los datos de

entrada de las planillas de estilos de aprendizaje (ver sección A.3.1 – Datos

Codificados) con los clusters resultantes de aplicar la red S.O.M. a dichos.
Nodo 0
Distribución de la Clase
Elemento Valor
Tipo Rama
Numero de registros 234 cluster 2
Clase Mayoritaria 3 6%
Observaciones totales (%) 100.00%
Observaciones mal 5.98%
clasificadas (%)
Distribución de la clase cluster 3

94%
Cluster Proporción
2 5.98%
3 94.027% cluster 2 cluster 3
Nodo 1
Elemento Valor
Tipo Hoja cluster 2
Numero de registros 84 0%
Clase Mayoritaria 35.9%
Observaciones totales (%) 3
clasificadas (%)
Distribución de la clase
cluster 3
100%
Cluster Proporción
2 0.00%
Nodo 2
Elemento Valor
Tipo Hoja
Clase Mayoritaria 61.54% 6%
clasificadas (%)

94%
Cluster Proporción
2 5.56%

Nodo 3
Elemento Valor
Tipo Hoja
0%
clasificadas (%)
cluster 2
Cluster Proporción 100%
2 100.00%
Nodo 4
Elemento Valor
Tipo Rama
Clase Mayoritaria 35.90% 5%
clasificadas (%)

95%
Cluster Proporción
2 4.76%
Nodo 5
Elemento Valor
Tipo Hoja cluster 2
clasificadas (%)
cluster 3
100%
Cluster Proporción
2 0.00%

Nodo 6
Elemento Valor
Tipo Rama
0%
clasificadas (%)
cluster 2
2 100.00%
Nodo 7
Elemento Valor
Tipo Hoja cluster 2
Numero de Registros 68 0%
Observaciones totales (%) 29.06%
Clase Mayoritaria 3
observaciones mal 0.00%
clasificadas en porcentual
cluster 3
100%
Cluster Proporción
2 0.00%
Nodo 8
Elemento Valor
Tipo Rama
Numero de registros 14
Clase Mayoritaria 5.98% cluster 2
Observaciones totales (%) 3 14%
clasificadas (%)
cluster 3
Distribución de la clase 86%
Cluster Proporción
2 14.29%

Nodo 9
Elemento Valor
Tipo Hoja
0%
clasificadas (%)
cluster 2
2 100.00%
Nodo 10
Elemento Valor
Tipo Hoja cluster 2
clasificadas (%)
cluster 3
100%
Cluster Proporción
2 0.00%
Nodo 11
Elemento Valor
Tipo Hoja cluster 2
clasificadas (%)
cluster 3
100%
Cluster Proporción
2 0.00%

Nodo 12
Elemento Valor
Tipo Hoja
0%
clasificadas (%)
cluster 2
2 100.00%
A.5 – Red Backpropagation
La selección de un único protocolo pedagógico es restrictiva con respecto a los

contenidos posibles del dominio, por lo cual se entrenara una red del tipo
Backpropagation para que el modelo planteado sea aplicable en casos los de dominios
incompletos y consistente a las hipótesis.
A.5.1 – Datos de entrenamiento para la red Backpropagation.
En la Tabla A.26 se listan los datos utilizados para entrenar la red del tipo
Backpropagation y obtener luego un “score” o “ranking” de los posibles protocolos
pedagógicos.
Protocolo Pedagógico Carrera Observación
Socrático 4 1
Socrático 5 2
Socrático 5 3
Socrático 0 4
Socrático 0 5
Magistral 2 6
Magistral 3 7
Magistral 1 8
Magistral 4 9
Magistral 5 10
Magistral 4 11
Magistral 4 12
Magistral 5 13
Magistral 6 14
Magistral 4 15
Magistral 1 16
Magistral 4 17
Magistral 5 18
Magistral 5 19

Magistral 4 20
Magistral 5 21
Magistral 4 22
Magistral 4 23
Magistral 4 24
Magistral 4 25
Magistral 1 26
Magistral 1 27
Magistral 1 28
Magistral 5 29
Magistral 1 30
Magistral 4 31
Magistral 4 32
Magistral 5 33
Magistral 5 34
Magistral 4 35
Magistral 1 36
Magistral 4 37
Magistral 1 38
Magistral 4 39
Magistral 4 40
Magistral 3 41
Magistral 4 42
Magistral 1 43
Magistral 4 44
Magistral 7 45
Magistral 4 46
Magistral 5 47
Magistral 5 48
Magistral 4 49
Magistral 4 50
Magistral 4 51
Magistral 4 52
Magistral 4 53
Magistral 5 54
Magistral 3 55
Magistral 5 56
Magistral 5 57
Magistral 3 58
Magistral 5 59
Magistral 4 60
Magistral 3 61
Magistral 8 62
Magistral 1 63
Magistral 3 64
Magistral 3 65
Magistral 5 66
Magistral 6 67
Magistral 3 68
Magistral 7 69
Magistral 2 70

Magistral 2 71
Magistral 4 72
Magistral 3 73
Magistral 5 74
Magistral 8 75
Magistral 0 76
Magistral 0 77
Magistral 0 78
Magistral 0 79
Magistral 9 80
Magistral 0 81
Magistral 0 82
Magistral 9 83
Magistral 0 84
Magistral 9 85
Magistral 0 86
Magistral 0 87
Magistral 0 88
Magistral 0 89
Magistral 0 90
Magistral 0 91
Magistral 9 92
Magistral 9 93
Magistral 9 94
Magistral 0 95
Magistral 9 96
Magistral 0 97
Magistral 9 98
Magistral 0 99
Magistral 0 100
Magistral 0 101
Magistral 0 102
Magistral 0 103
Magistral 9 104
Magistral 0 105
Magistral 9 106
Magistral 9 107
Magistral 0 108
Magistral 0 109
Magistral 0 110
Magistral 0 111
Magistral 0 112
Magistral 0 113
Magistral 0 114
Magistral 0 115
Magistral 0 116
Magistral 0 117
Socrático 1 118
Tabla A.26: Datos utilizados para el entrenamiento de la red del tipo
Backpropagation.

A.5.2 – “Score” Obtenido de las Observaciones Utilizando la Red Backpropagation
Se muestran ahora los resultados, con los puntajes obtenidos por las distintas
observaciones relevadas por medio de la planilla de estilos de aprendizaje. En la Tabla
A.27 se pueden ver los resultados obtenidos utilizando la red entrenada, el protocolo
predicho y el puntaje para cada uno de los protocolos disponibles.
Output
Tipo Salida (Salida)
Protocolo Puntaje (2) Puntaje (3)
Obs No. Protocolo Predicho Socrático Magistral
1 2 2 0,72920364 0,28641269
2 2 3 0,00420061 0,99459732
3 2 3 0,00437272 0,99441481
4 2 3 0,00980494 0,98860174
5 2 3 0,00498649 0,99380898
6 2 3 0,07856944 0,91858882
7 3 3 0,00457859 0,99425501
8 3 3 0,00446060 0,99438852
9 3 3 0,01291529 0,98618466
10 3 3 0,00415787 0,99464726
11 3 3 0,00980494 0,98860174
12 3 3 0,00405812 0,99477100
13 3 3 0,00740716 0,99073237
14 3 3 0,01087097 0,98757231
15 3 3 0,0044431 0,99452043
16 3 3 0,00412031 0,99469244
17 3 3 0,01122339 0,98778611
18 3 3 0,00420061 0,99459732
19 3 3 0,0044946 0,99429500
20 3 3 0,00408124 0,99474418
21 3 3 0,00424933 0,99454194
22 3 3 0,00449460 0,99429500
23 3 3 0,00424933 0,99454194
24 3 3 0,00420061 0,99459732
25 3 3 0,00420061 0,99459732
26 3 3 0,00424933 0,99454194
27 3 3 0,01515141 0,98407018
28 3 3 0,01515141 0,98407018
29 3 3 0,01291529 0,98618466
30 3 3 0,00432234 0,99446601
31 3 3 0,01122339 0,98778611
32 3 3 0,00420061 0,99459732
33 3 3 0,00415787 0,99464726
34 3 3 0,01087097 0,98757231
35 3 3 0,00432234 0,99446601
36 3 3 0,00412031 0,99469244
37 3 3 0,00992244 0,98901963
38 3 3 0,00424933 0,99454194
39 3 3 0,00992244 0,98901963
40 3 3 0,00420061 0,99459732
41 3 3 0,00415787 0,99464726

42 3 3 0,0045473 0,99430299
43 3 3 0,00424933 0,99454194
44 3 3 0,01291529 0,98618466
45 3 3 0,00415787 0,99464726
46 3 3 0,00453497 0,99418825
47 3 3 0,00415787 0,99464726
48 3 3 0,00823588 0,99012327
49 3 3 0,01220238 0,98628980
50 3 3 0,00424933 0,99454194
51 3 3 0,00420061 0,99459732
52 3 3 0,00424933 0,99454194
53 3 3 0,00874755 0,98933774
54 3 3 0,00415787 0,99464726
55 3 3 0,00980494 0,98860174
56 3 3 0,00409864 0,99477005
57 3 3 0,00980494 0,98860174
58 3 3 0,00449460 0,99429500
59 3 3 0,00426307 0,99458957
60 3 3 0,01087097 0,98757231
61 3 3 0,00874755 0,98933774
62 3 3 0,00426307 0,99458957
63 3 3 0,00457526 0,99419957
64 3 3 0,01291529 0,98618466
65 3 3 0,00421338 0,99464226
66 3 3 0,0044606 0,99438852
67 3 3 0,00894184 0,98943752
68 3 3 0,00421252 0,99476504
69 3 3 0,00426307 0,99458957
70 3 3 0,00427175 0,99448252
71 3 3 0,00457859 0,99425501
72 3 3 0,00442835 0,99441707
73 3 3 0,00420061 0,99459732
74 3 3 0,00421338 0,99464226
75 3 3 0,00449460 0,99429500
76 3 3 0,01598717 0,98221719
77 3 3 0,00498649 0,99380898
78 3 3 0,00513425 0,99366325
79 3 3 0,00498649 0,99380898
80 3 3 0,00513425 0,99366325
81 3 3 0,01162295 0,98687679
82 3 3 0,04385835 0,95366597
83 3 3 0,00513425 0,99366325
84 3 3 0,00453776 0,99432725
85 3 3 0,00513425 0,99366325
86 3 3 0,00453776 0,99432725
87 3 3 0,00530588 0,99349499
88 3 3 0,00513425 0,99366325
89 3 3 0,00498649 0,99380898
90 3 3 0,00530588 0,99349499
91 3 3 0,00530588 0,99349499
92 3 3 0,00498649 0,99380898
93 3 3 0,00445446 0,99440676

94 3 3 0,00847284 0,98994881
95 3 3 0,00438148 0,99447745
96 3 3 0,05826632 0,93910235
97 3 3 0,00681117 0,99158704
98 3 3 0,00498649 0,99380898
99 3 3 0,00453776 0,99432725
100 3 3 0,00485881 0,99393594
101 3 3 0,05826632 0,93910235
102 3 3 0,00513425 0,99366325
103 3 3 0,00485881 0,99393594
104 3 3 0,00513425 0,99366325
105 3 3 0,01546693 0,98315006
106 3 3 0,07856944 0,91858882
107 3 3 0,00453776 0,99432725
108 3 3 0,00438148 0,99447745
109 3 3 0,00513425 0,99366325
110 3 3 0,00485881 0,99393594
111 3 3 0,05826632 0,93910235
112 3 3 0,00498649 0,99380898
113 3 3 0,00498649 0,99380898
114 3 3 0,00485881 0,99393594
115 3 3 0,04385835 0,95366597
116 3 3 0,00498649 0,99380898
117 3 3 0,00513425 0,99366325
118 3 3 0,00513425 0,99366325
119 3 3 0,05826632 0,93910235
120 3 3 0,00453776 0,99432725
Tabla A.27: Puntajes asignados a los datos de entrenamiento de la red tipo Backpropagation, donde se
detalla la observación, los atributos para dicha observación y el cluster al que pertenece. En las ultimas tres
columnas se encuentran los puntajes asignados a cada una de las familias y el protocolo pedagógico
seleccionado por la red.

A.6 – Datos de los Cursos de Prueba
A continuación se muestran los datos de los alumnos relevados en los cursos

observados, con las notas de las evaluaciones parciales, trabajos prácticos y
evaluaciones integradoras utilizadas para realizar la inferencia. En la Tabla A.28 se
pueden ver los datos sin discriminar por curso.

Parciales Prácticos Integradoras
Recuperatorio 1
Recuperatorio 2
Primer Parcial
Práctico 1
Práctico 2
Trabajo
Trabajo
Final 1
Final 2
Final 3
Nombre y Apellido
(codificado)31
Nicolás, A. 2 2 5 4 9 7 - -
Pablo Daniel, A. 2 6 4 9 4 - -
Roxana Maribel, A. 2 A 8 4 9 7 - -
Ignacio Pablo, A A 2 5 4 9 5 - -
Lucas Ariel B. 7 - - 4 9 5 - -
German B. 2 2 2 - - - - -
Darío Oscar, B. 2 2 8 4 8 5 - -
Gustavo, Daniel B. A A 4 4 9 5 - -
Domingo, B. 2 2 2 4 8 - - -
Luís Andrés B. 4 - - 4 8 6 - -
Norberto Gabriel C. 2 2 8 4 9 2 7 -
Juan Martín, C. 2 2 5 4 10 4 - -
Claudio Luciano 2 A 4 4 10 2 - -
Rene Carlos, C. 2 4 - 4 9 2 4 -
Mariano Nahuel, C. A 2 6 4 9 9 - -
Fabio, C. 2 4 4 8 4 - - -
Julio Nicolás, C. A A A - - - - -
Fernando Martín, C. 4 - - 4 8 2 4 -
Beatriz Analía 2 2 5 4 8 8 - -
Graciela Natalia, E. L. A A A - - - - -
Maria Eugenia, D 2 2 9 4 8 5 - -
Ramiro Carlos, F 2 2 4 4 8 5 - -
Damián Alejandro, F 2 2 4 4 10 4 - -
Paula Soledad, F. 7 - - 4 8 8 - -
Sebastián Gerardo 2 5 - 4 10 9 - -
Eduardo Federico, F. 2 2 9 4 8 2 2 7
Mari cruz Vanesa 2 2 2 4 8 - - -
Sabrina, G. 4 - - 4 8 8 - -
Damián, G. P. 2 2 8 4 7 7 - -
Gerardo Andrés, G 2 A A 4 8 - - -
Gastón Matías, G. 2 6 - 4 6 2 5 -
31
Para mantener la confidencialidad de los datos, solo se pondrá el nombre del estudiante y la inicial del
apellido, o de los apellidos. Esto no modifica los resultados, ya que éstos se analizan con fines
estadísticos y no personales.

Federico, H. A A 4 4 7 2 7 -
Gabriel Matías, H. 2 7 - 4 9 2 8 -
Lucila, H. 2 2 2 - - - - -
Herman Matas, J. 4 - - 4 8 2 2 4
Mayya, C. 2 2 2 4 8 - - -
Pablo Daniel, L 2 A A 4 8 - - -
Maria Laura, M. 2 2 2 4 8 - - -
Fernando Gabriel, M. 4 - - 4 9 7 - -
Patricio. M. 5 7 - A 10 10 - -
Jimena, M. 2 4 - 4 8 2 2 4
Martín Miguel, M. A 2 4 4 9 1 - -
Maia Raquel, N. 2 A 7 4 8 7 - -
Nahuel Fernando. N. 2 2 2 4 10 - - -
Alejandro Daniel, N. 2 2 7 4 8 2 7
Fernando Ariel, O. 2 2 5 4 9 2 2 2
Teresa, O. A A A - - - - -
Federico Martín, H. 2 A 4 4 9 2 2 4
Sebastián Gastón 2 2 2 4 10 - - -
Nicolás Sebastián, P. 2 2 4 4 7 2 - -
Santiago Pablo, P. 2 4 - 4 9 2 4 -
Federico Andrés, P. 2 4 - 4 9 6 - -
Marianela Elizabeth 9 - - 4 9 2 5 -
Pablo Manuel, Q. A A 2 4 9 - - -
Martín Gabriel, R. M. 2 2 6 4 6 7 - -
Andrés Pablo, R. 2 7 - 4 7 7 - -
Cesar, R. A 2 2 4 9 - - -
Cesar Heriberto, R. C. A 2 6 4 9 2 4 -
Augusto Cesar, R. 2 A 7 4 9 1 2 4
Fernando, R. 2 A 6 4 6 2 6 -
Pablo, S. 2 A 2 4 7 - - -
Leonardo Ariel, S. 2 A 7 4 8 5 - -
Pablo Antonio, S. A A A - - - - -
Miguel Ángel, S. 4 - - 4 4 2 6 -
Nicolás Max., S. 2 A 2 4 9 - - -
Adrián Estaban, S. A 2 4 4 8 4 - -
Mariana Paula, S. A 2 4 4 8 4 - -
Federico Carlos 2 2 4 4 8 4 - -
Esteban Gabriel, T. A 2 7 4 9 4 - -
Martín Ignacio, U. A A 4 4 9 1 6 -
Edwin V. B. 2 2 2 4 8 - - -
Mario Ignacio, W. 8 - - 4 9 2 8 -
Verónica Noemí, z. 2 2 8 4 9 2 8 -
Julián Rolando, z A 2 7 4 9 2 2 2
Martín Andrés, S. A A 5 4 5 7 - -
Cristina, F. A 2 2 4 5 - - -
Federico, A. 2 A A - - - - -
Matías Leones, A. 2 2 6 4 4 2 2 5
Rodrigo Iván, A. 2 4 - 4 4 2 2 2
Ezequiel, A. I. 7 - - 4 7 8 - -
Mauro Sebastián, a. 2 4 - 4 4 2 4 -
Román, B. 2 2 2 4 - - - -
Sergio Omar, B. A A 2 4 - - - -

Pablo, B. 2 6 - 4 5 6 - -
Juana Inés, C. M. 2 4 - 4 2 7 - -
Sebastián Horacio, C. 2 6 - 4 2 2 4 -
Andrés Sebastián, C. 4 - - 4 6 2 4 -
Mauricio Ariel, C. 2 4 - 4 4 2 8 -
Iván Alejandro, C. A A A 4 - - - -
Cristian, C. 2 2 2 4 - - - -
Matías Ezequiel, C 2 2 4 4 6 2 2 2
Maximiliano Pablo, C 6 - - 4 7 5 - -
Ezequiel, Osvaldo 4 - - 4 8 2 4 -
Fernando Antonio, D. 2 7 - 4 4 4 - -
Bárbara, D. 2 2 2 4 - - - -
Yanina Alejandra, F. A A 2 4 - - - -
Nicolás Sebastián, F. 2 4 - 4 5 2 2 5
Marcelo German, f. 2 2 5 4 4 6 - -
Alejandro Manuel, G. A A A 4 - - - -
Marcos Alejandro, G. 2 7 - 4 4 2 6 -
Leonardo Daniel, G. 2 4 - 4 2 - - -
Pablo German, G. 2 2 2 4 - - - -
Hernan, G. 2 8 - 4 6 2 5 -
Jessica Andrea, G 2 2 2 4 7 - - -
Maria Florencia, J. A A A 4 - - - -
Oscar Aníbal, L. 2 2 2 4 - - - -
Daniela Alejandra, L. 2 2 2 4 5 - - -
Carlos, M. 2 2 2 4 - - - -
Pablo Oscar, L. 2 A A 4 - - - -
Gabriel Angel, M. A A A 4 - - - -
Fernando Ezequiel, M. 4 - - 4 7 4 - -
Damián Ariel, M 2 4 - 4 4 2 4 -
Martín Guillermo, M. 2 2 9 4 4 4 - -
Oscar Horacio, N. A A A 4 - - - -
Sebastián Ariel, O 7 - - 4 9 2 7 -
Marín Daniel, O. A 2 4 4 4 2 2 2
Pablo Alejandro P. C. 2 2 2 4 - - - -
Sebastián Leonardo, P 2 2 7 4 5 2 2 2
Emmanuel Eduardo 2 10 - 4 7 7 - -
Pablo Adrián, P. 2 5 - 4 4 - - -
Tabla A.28: Resultados académicos de 121 alumnos pertenecientes a las materias
Algoritmos y Programación I y Computación de la Facultad de Ingeniería de la
Universidad de Buenos Aires.

A.6.1 – Alumnos Clasificados por la Red Backpropagation Entrenada del Curso A.
A continuación se detalla en la Tabla A.29 el protocolo pedagógico predicho por la red

backpropagation para cada uno de los estudiantes, así como también su desempeño a lo
largo del Curso A.

Trabajo Práctico
Trabajo Práctico
Recuperatorio 1
Recuperatorio 2
Primer Parcial
Protocolo
predicho
Final1
Final2
Final3
Curso
Nombre y Apellido
2
(codificado)
Nicolás, A. 2 2 5 4 9 7 - - A 1
Pablo Daniel, A. 2 6 4 9 4 - - A 2
Roxana Maribel, A. 2 A 8 4 9 7 - - A 2
Ignacio Pablo, A A 2 5 4 9 5 - - A 1
Lucas Ariel B. 7 - - 4 9 5 - - A 1
Darío Oscar, B. 2 2 8 4 8 5 - - A 1
Gustavo, Daniel B. A A 4 4 9 5 - - A 1
Domingo, B. 2 2 2 4 8 - - - A 1
Luís Andrés B. 4 - - 4 8 6 - - A 1
Norberto Gabriel C. 2 2 8 4 9 2 7 - A 1
Juan Martín, C. 2 2 5 4 10 4 - - A 1
Claudio Luciano 2 A 4 4 10 2 - - A 1
Rene Carlos, C. 2 4 - 4 9 2 4 - A 1
Mariano Nahuel, C. A 2 6 4 9 9 - - A 1
Fabio, C. 2 4 4 8 4 - - - A 1
Fernando Martín, C. 4 - - 4 8 2 4 - A 1
Beatriz Analía 2 2 5 4 8 8 - - A 1
Graciela Natalia, E. L. A A A - - - - - A 1
Maria Eugenia, D 2 2 9 4 8 5 - - A 1
Ramiro Carlos, F 2 2 4 4 8 5 - - A 1
Damián Alejandro, F 2 2 4 4 10 4 - - A 1
Paula Soledad, F. 7 - - 4 8 8 - - A 1
Sebastián Gerardo 2 5 - 4 10 9 - - A 1
Eduardo Federico, F. 2 2 9 4 8 2 2 7 A 1
Sabrina, G. 4 - - 4 8 8 - - A 1
Damián, G. P. 2 2 8 4 7 7 - - A 1
Gastón Matías, G. 2 6 - 4 6 2 5 - A 1
Federico, H. A A 4 4 7 2 7 - A 1
Gabriel Matías, H. 2 7 - 4 9 2 8 - A 1
Herman Matas, J. 4 - - 4 8 2 2 4 A 1
Fernando Gabriel, M. 4 - - 4 9 7 - - A 1
Patricio. M. 5 7 - A 10 10 - - A 2
Jimena, M. 2 4 - 4 8 2 2 4 A 1
Martín Miguel, M. A 2 4 4 9 1 - - A 1
Maia Raquel, N. 2 A 7 4 8 7 - - A 1
Nahuel Fernando. N. 2 2 2 4 10 - - - A 1
Alejandro Daniel, N. 2 2 7 4 8 2 7 A 2

Fernando Ariel, O. 2 2 5 4 9 2 2 2 A 1
Teresa, O. A A A - - - - - A 1
Federico Martín, H. 2 A 4 4 9 2 2 4 A 2
Sebastián Gastón 2 2 2 4 10 - - - A 1
Nicolás Sebastián, P. 2 2 4 4 7 2 - - A 1
Santiago Pablo, P. 2 4 - 4 9 2 4 - A 1
Federico Andrés, P. 2 4 - 4 9 6 - - A 1
Marianela Elizabeth 9 - - 4 9 2 5 - A 1
Martín Gabriel, R. M. 2 2 6 4 6 7 - - A 1
Andrés Pablo, R. 2 7 - 4 7 7 - - A 1
Tabla A.29: Resultados académicos y de clasificación de los alumnos pertenecientes al Curso A.
A.6.2 – Alumnos Clasificados por la Red Backpropagation Entrenada del Curso B.
A continuación se detalla en la Tabla A.30 el protocolo pedagógico predicho por la red

Backpropagation para cada uno de los estudiantes, así como también su desempeño a lo
largo del Curso B.

Trabajo Práctico
Trabajo Práctico
Recuperatorio 1
Recuperatorio 2
Primer Parcial
Protocolo
predicho
Final1
Final2
Final3
Curso
Nombre y Apellido
1
(codificado)
Cesar, R. A 2 2 4 9 - - - B 1
Cesar Heriberto, R. C. A 2 6 4 9 2 4 - B 1
Augusto Cesar, R. 2 A 7 4 9 1 2 4 B 1
Fernando, R. 2 A 6 4 6 2 6 - B 1
Pablo, S. 2 A 2 4 7 - - - B 1
Leonardo Ariel, S. 2 A 7 4 8 5 - - B 1
Pablo Antonio, S. A A A - - - - - B 1
Miguel Ángel, S. 4 - - 4 4 2 6 - B 2
Nicolás M., S. 2 A 2 4 9 - - - B 1
Adrián Estaban, S. A 2 4 4 8 4 - - B 1
Mariana Paula, S. A 2 4 4 8 4 - - B 1
Federico Carlos 2 2 4 4 8 4 - - B 1
Esteban Gabriel, T. A 2 7 4 9 4 - - B 1
Martín Ignacio, U. A A 4 4 9 1 6 - B 1
Edwin V. B. 2 2 2 4 8 - - - B 1
Mario Ignacio, W. 8 - - 4 9 2 8 - B 1
Verónica Noemí, z. 2 2 8 4 9 2 8 - B 1
Julián Rolando, z A 2 7 4 9 2 2 2 B 1
Martín Andrés, S. A A 5 4 5 7 - - B 1
Cristina, F. A 2 2 4 5 - - - B 1
Federico, A. 2 A A - - - - - B 1
Matías Leones, A. 2 2 6 4 4 2 2 5 B 1
Rodrigo Iván, A. 2 4 - 4 4 2 2 2 B 1
Ezequiel, A. I. 7 - - 4 7 8 - - B 1
Mauro Sebastián, A. 2 4 - 4 4 2 4 - B 1

Román, B. 2 2 2 4 - - - - B 1
Sergio Omar, B. A A 2 4 - - - - B 1
Pablo, B. 2 6 - 4 5 6 - - B 1
Juana Inés, C. M. 2 4 - 4 2 7 - - B 1
Sebastián Horacio, C. 2 6 - 4 2 2 4 - B 1
Andrés Sebastián, C. 4 - - 4 6 2 4 - B 1
Mauricio Ariel, C. 2 4 - 4 4 2 8 - B 1
Iván Alejandro, C. A A A 4 - - - - B 1
Cristian, C. 2 2 2 4 - - - - B 1
Matías Ezequiel, C 2 2 4 4 6 2 2 2 B 1
Maximiliano Pablo, C 6 - - 4 7 5 - - B 1
Ezequiel, Osvaldo 4 - - 4 8 2 4 - B 1
Fernando Antonio, D. 2 7 - 4 4 4 - - B 1
Bárbara, D. 2 2 2 4 - - - - B 1
Yanina Alejandra, F. A A 2 4 - - - - B 1
Nicolás Sebastián, F. 2 4 - 4 5 2 2 5 B 1
Marcelo Germán, f. 2 2 5 4 4 6 - - B 1
Alejandro Manuel, G. A A A 4 - - - - B 1
Marcos Alejandro, G. 2 7 - 4 4 2 6 - B 1
Leonardo Daniel, G. 2 4 - 4 2 - - - B 1
Pablo Germán, G. 2 2 2 4 - - - - B 1
Hernán, G. 2 8 - 4 6 2 5 - B 1
Jessica Andrea, G 2 2 2 4 7 - - - B 1
Maria Florencia, J. A A A 4 - - - - B 1
Oscar Aníbal, L. 2 2 2 4 - - - - B 1
Daniela Alejandra, L. 2 2 2 4 5 - - - B 1
Carlos, M. 2 2 2 4 - - - - B 1
Pablo Oscar, L. 2 A A 4 - - - - B 1
Gabriel Ángel, M. A A A 4 - - - - B 1
Fernando Ezequiel, M. 4 - - 4 7 4 - - B 1
Damián Ariel, M 2 4 - 4 4 2 4 - B 1
Martín Guillermo, M. 2 2 9 4 4 4 - - B 1
Oscar Melchor, N. A A A 4 - - - - B 1
Sebastián Ariel, O 7 - - 4 9 2 7 - B 1
Marín Daniel, O. A 2 4 4 4 2 2 2 B 1
Pablo Alejandro P. C. 2 2 2 4 - - - - B 1
Sebastián Leonardo, P 2 2 7 4 5 2 2 2 B 1
Emmanuel Eduardo 2 10 - 4 7 7 - - B 1
Pablo Adrián, P. 2 5 - 4 4 - - - B 1
Tabla A.30: Resultados académicos y de clasificación de los alumnos pertenecientes al Curso B.

Sistemas Inteligentes para El Modelado Del Tutor

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Sistemas Inteligentes para El Modelado Del Tutor

Enviado por

Direitos autorais:

Formatos disponíveis

SISTEMAS INTELIGENTES PARA EL

MODELADO DEL TUTOR

TESIS DE GRADO EN INGENIERIA INFORMATICA

UNIVERSIDAD DE BUENOS AIRES

Tesista: Sr. Fernando A. SALGUEIRO

Director: Prof. Dr. Ramón GARCÍA-MARTÍNEZ

Co-Directora: Prof. M. Ing. Zulma CATALDI

Laboratorio de Sistemas Inteligentes

Keywords: Pedagogical strategies, Natural Language, Tutor Module, Neural Networks,

Al Prof. M. Ing. Fernando J. Lage, profesor del Departamento de Computación de la

A la Universidad de Buenos Aires y a la Facultad de Ingeniería, por su apoyo para

También, a mi hermana Mariana y a mi queridísimo abuelo Adolfo, quienes siempre

RESUMEN Fernando A. Salgueiro V

Capítulo 2 - Estado del Arte 24

RESUMEN Fernando A. Salgueiro VII

2.3.5 – Módulos Externos: Evaluación y Registros Históricos 64

Capítulo 3 - Descripción del Problema 87

Capitulo 4 – Solución Propuesta 94

Capitulo 5 – Resultados Experimentales 115

VIII Fernando A. Salgueiro RESUMEN

5.4.1 – Inducción Utilizando Atributos con Mayor Ganancia de Información 124

Capítulo 6 - Conclusiones 133

Anexo A: Datos Experimentales para el Submódulo Pedagógico 147

RESUMEN Fernando A. Salgueiro IX

Capitulo 4 – Solución Propuesta

Capitulo 5 – Resultados Experimentales

X Fernando A. Salgueiro RESUMEN

Capitulo 5 – Resultados Experimentales

Anexo A: Datos Experimentales para el Submódulo Pedagógico

RESUMEN Fernando A. Salgueiro XI

Tabla A.22: Undécimo grupo de preguntas relevadas. 172

XII Fernando A. Salgueiro RESUMEN

ANN = Artificial Neuronal Network.

ART = Adaptative Resonancy Theory

BAM = Bidirectional Associative Memory

CAD = Computer Aided Design

CAE = Computer Aided Engineering

CAI = Computer Assisted Instruction

CIM = Computer Integrated Manufacturing

INCO = Ingeniería del Conocimiento

KBES = Knowledge-Based Expert Systems.

LCS =Learning Companion Systems.

LMS = Least Mean Squared Error

NSTI = Nuevos Sistemas Tutores Inteligentes

OOP = Object Oriented Programming

STI = Sistemas Tutores Inteligentes

VLSI = Very Large Scale Integration

RESUMEN Fernando A. Salgueiro XIII

Una de las tareas de la arquitectura de los STI es la sistematización del conocimiento

De esta manera, se pueden desarrollar Sistemas Tutores Inteligentes (STI) y Sistemas

14 Fernando A. Salgueiro INTRODUCCIÓN

1.2 - Descripción General del Problema

Este tema de investigación surge motivado por la necesidad de encontrar diferentes

Por este motivo, se pensó en principio, en el desarrollo de un Sistema Tutor Inteligente

Wenger [Wenger, 1978] define la tarea de la enseñanza en términos de una

Se ha observado que los Sistemas Tutores y Asesores Inteligentes disponibles en la

En un Sistema Tutor Inteligente (STI), el modelo del tutor es el encargado de definir y

INTRODUCCIÓN Fernando A. Salgueiro 15

responsable de seleccionar los problemas, de monitorear y de criticar el desempeño, de

Aún hoy día, la mayoría de los desarrolladores de programas “didácticos” se basan en

El aporte del presente trabajo permitirá esclarecer algunos interrogantes respecto de

Se ha observado que en los cursos universitarios de los primeros cuatrimestres de las

En la literatura analizada se han encontrado dos posturas para la implementación de los