Você está na página 1de 12

Untelsciencia-Perú,1(1),2016, Lima Presentado: 19/10/2015

ISSN 2414-2751 Aceptado: 22/12/2015


Depósito legal 0000-0000
© Universidad Nacional Tecnológica de Lima Sur (Untels)

MODELO PREDICTIVO PARA LA IDENTIFICACIÓN DE PATRONES DE LA


DESERCIÓN ESTUDIANTIL EN LA UNIVERSIDAD NACIONAL TECNOLÓGICA DE
LIMA SUR (UNTELS)

PREDICTIVE MODEL FOR IDENTIFICATION OF PATTERNS OF THE STUDENT


DESERTION AT NATIONAL TECHNOLOGY UNIVERSITY OF LIMA SOUTH
(UNTELS)

Myrna Manco Caycho1

Resumen
Con el objetivo de determinar los patrones del entorno que impactan en la deserción de los
estudiantes de la Universidad Nacional Tecnológica de Lima Sur (Untels), se elabora una base de
datos socioeconómica y académica de los estudiantes de la cohorte 2007-I a 2011-I, que incluye
los casos de deserción como variable dependiente. Se elaboran seis modelos utilizando el operador
Decision Tree de RapidMiner, con y sin validación cruzada, y con parámetros modificados y la im-
plementación de la herramienta Weka, W-J48. Los modelos desarrollados se comparan por su preci-
sión y por la medida F-score. La implementación W-J48 con parámetros modificados y análisis de
sensibilidad mediante proporción de ganancia de información y sistema de validación cruzada de
10 particiones, ofreció la precisión más alta, así como un árbol simple de uso y de interpretación.
El modelo final detectó las siguientes características o patrones del entorno que impactan en
la deserción de los estudiantes de la Untels: Número de matrículas en los cuatro semestres conse-
cutivos a su ingreso, Promedio en su segunda matrícula, Edad de ingreso, Promedio en su cuarta
matrícula, Año de ingreso, Número de personas dependientes, Semestre de ingreso y Número de
cursos aprobados en su primera matrícula. Se logró un 90.10% de clasificación correcta, con una
desviación estándar de 2.08%. El principal patrón detectado para los desertores, es que el número
de matrículas en los cuatro semestres consecutivos a su ingreso sea menor o igual que 3, con una
precisión de 88%.
Palabras claves: Deserción universitaria. Integración académica. Integración social. Minería de
datos. Modelo predictivo. Árboles de decisión.

Abstract
In order to determine the environment that impact the students desertion at Untels, a socio-eco-
nomic and academic database is elaborated students in the cohort 2007-I to 2011-I, which the
includes cases of desertion as dependent variable. Six models are developed using the Decision
Tree of RapidMiner operator, with and without cross-validation, and modified parameters and im-
plementation of Weka, W-J48 tool. The developed models are compared through their accuracy
and F-score measure. The W-J48 implementation with modified parameters and sensitivity analysis
using information of gain ratio and cross-validation of 10 partitions, offered the highest accuracy as
well a simple tree use and interpretation.

1
Universidad Nacional Tecnológica de Lima Sur (Untels)
Modelo predictivo para la identificación de patrones de la deserción estudiantil en la Untels

The final model detected the following characteristics or environment patterns that impact the
students desertion at Untels: Number of enrolled students in the four consecutive semesters since
their income, average enrollment in its second, Age of entry, in its fourth Average tuition Year of
income, number of dependents, income and Semester Number of approved courses in their first
enrollment. So 90.10% correct classification was achieved, with a standard deviation of 2.08%.
The main pattern detected for deserters, is that the number of enrollments in the four consecutive
semesters of your income is less than or equal to 3, with an accuracy of 88%.
Key words: University desertion. Academic integration. Social integration. Data mining. Predicti-
ve model. Decision trees.

Introducción hasta esa fecha; al semestre 2011-II, la cohorte


La deserción estudiantil universitaria es que ingresó en el semestre 2007-I, registró un
un problema que se manifiesta a nivel nacional porcentaje de no matrícula del 34.5%, seguida
como internacional tanto en instituciones pri- por la cohorte del semestre 2008-I con un por-
vadas como nacionales, su estudio es enfocado centaje respectivo de 27.0%. La primera pro-
con diversos indicadores (Tasas de abandono, moción de egresados contó con 19 estudiantes
Tasa de término, Tasa anual de deserción, de- de 235 que ingresaron en el semestre 2007-I,
serción por cohorte de ingreso, etc) con por- lo que significa que sólo un 8% de estudiantes
centajes muy oscilantes que van desde 7% hasta logró terminar en el tiempo previsto (Oficina de
50% como lo revela [1], [2], [3], [4], [5], [6], Informática y Estadística-Untels).
[7], [8], [9], [10], [11], [12], [13], [14], [15]. En Sobre las causas de la deserción estudian-
Perú, en promedio el 43.7% de estudiantes que til se han hecho muchas investigaciones obte-
ingresan a las universidades concluyen con sus niendo conclusiones bastante diferenciadas se-
estudios [16]. No se dispone de datos de la Tasa gún países, carreras, género, periodo en el que
de deserción de estudiantes a nivel de Institu- se produce, rendimiento académico, vocación,
ciones de Educación Superior Universitaria [17] puntaje obtenido en el examen de selección,
y tampoco contamos con mecanismos oficiales entre otras como se aprecia en [2], [5], [8],
que permitan hacer seguimientos continuos de [13], [14], [22], [23], [25], [26], [27], [28], [30],
las características del Sistema de Educación [31], [35].
Superior Universitario, por tanto no se cuenta Díaz [27] propone un modelo conceptual
con indicadores oficiales que nos alerten de esta que explica la deserción/permanencia como
problemática y que más adelante podría agra- resultado de la motivación (positiva o negati-
varse de no tomar las medidas oportunas. Ante va), a su vez ésta es afectada por la integración
esta realidad, abordamos la problemática de la académica y social. Dicho modelo, resultado de
deserción estudiantil desde un ámbito social y un análisis cualitativo, permite ilustrar cómo
académico a fin de que contribuya en la calidad el estudiante debe adaptarse a los cambios en
de educación y se fomente una cultura de apro- las tensiones que se producen entre los distintos
vechamiento de datos para la toma preventiva factores académicos, sociales, individuales e
de decisiones. institucionales que lo afectan; éste será el punto
Al semestre 2011-II, la Untels acumuló un de partida para nuestro modelo.
total de 428 estudiantes no matriculados lo que Dada esta literatura, se desprende que se
representa un 16.7% del total de ingresantes han utilizando diferentes métodos para abordar

80 Untelsciencia-Perú. Enero 2016


M. MANCO CAYCHO

el estudio de esta problemática, sin embargo en b) Integración social: La integración social se


los últimos años se viene utilizando la minería manifiesta como la compatibilidad y buen
de datos orientada a la educación superior [3], entendimiento con la comunidad universi-
[24], [29], [32]. La minería de datos tiene mu- taria y en su entorno familiar. Se incluyen
chas ventajas frente a los demás métodos cuan- las características familiares (una dimen-
do se trata de trabajar con volúmenes de datos, sión efectiva, material, de disponibilidad de
por lo que decidimos abordar el tema de la de- recursos que la familia brinda al estudiante
serción estudiantil mediante estas técnicas. y una dimensión afectiva de soporte emo-
cional) y características individuales (ex-
Hipótesis periencias del estudiante fuera de la institu-
El modelo predictivo, que utiliza técnicas ción educativa).
de minería de datos, determina las característi- El presente estudio utiliza el método induc-
cas o patrones del entorno que impactan en la tivo, mediante el proceso de descubrimiento de
deserción de los estudiantes de la Untels. conocimiento en bases de datos (KDD Knowle-
dge Discovery in Databases), el cual consta de
Metodología 5 fases (Hernández Orallo [47]): (1) Integración
Considerando las limitaciones propias del y recopilación de datos, (2) Selección, limpieza
proceso de descubrimiento de conocimiento en y transformación, (3) Minería de datos, (4) Eva-
bases de datos se consiguió una vista minable luación e interpretación y (5) Difusión y uso.
de 1213 registros. Se utilizó fuentes de infor- Como método para la construcción del modelo
mación secundarias provenientes de la Oficina se usó el árbol de decisión.
de Bienestar Universitario y Registros Acadé- Se elaboró una base de datos socioeconó-
micos de la Untels. micos y académicos de los estudiantes de la Un-
Desertor tels, en una hoja de cálculo de Microsoft Office
Es aquél estudiante que habiendo realizado EXCEL 2007, para el procesamiento de datos
una primera matrícula en la Untels, no registra se usó el minero RapidMiner (ver 5.3), en el
matrícula durante dos o más semestres conse- cual se instaló el complemento Weka, que tam-
cutivos. bién es un software libre.
Integración con el entorno La hipótesis se evaluó con la precisión de
Describe como el estudiante se adapta (in- la clasificación, tal como lo señalan Krzsytof
tegra) al entorno universitario, el sentido de [46], Bing Liu [49] y Witten [39]. Adicional-
pertenencia a la institución y en consecuencia, mente Witten [39] y Bing Liu [50] proponen al
de alcanzar y concretar las metas académicas. F-score como una medida de uso frecuente para
Comprende el nivel de integración académica comparar diferentes modelos.
y social que alcance en la institución.
a) Integración académica: La integración aca- Resultados
démica se mide por el grado de congruencia Fase 1 y 2: Integración y recopilación de datos,
entre el desarrollo intelectual del individuo Selección, limpieza y transformación
y el clima intelectual de la institución. Está Entre los resultados descriptivos tenemos
conformada por las características preu- que la edad de los estudiantes oscila de 15 a 48
niversitarias (antecedentes personales, in- años con una edad promedio de 19,46 años, el
tenciones, expectativas, una formación aca- tiempo medio de preparación para ingresar a
démica previa sobre la cual no es posible la universidad es de 12,65 meses, la composi-
incidir directamente, un bagaje cultural y ac- ción familiar de los estudiantes varía de 1 a 11
titudinal) y características institucionales. miembros, con un tamaño promedio de aproxi-

Untels.cie.-Per. Vol. 1 Nº 1, pp. 79-90 81


Modelo predictivo para la identificación de patrones de la deserción estudiantil en la Untels

madamente 5 miembros, el ingreso de los estu- registraron dos matrículas, también desertaron,
diantes va desde 0 (no trabaja) hasta S/. 4500.00 para aquellos que registraron sus cuatro ma-
La mayoría de los estudiantes (71%) pertenecen trículas consecutivas no observamos informa-
al sexo masculino, el 97% de los estudiantes es ción relevante, por lo que sospechamos que el
soltero, el 53% de los estudiantes vive en el dis- número de matrículas en los cuatro semestres
trito de Villa El Salvador, el 79% de los estu- consecutivos a su ingreso si es determinante. Si
diantes proviene de un colegio nacional, el 64% comparamos el comportamiento según carrera
de los estudiantes ingresó por la modalidad de profesional, no se observan diferencias impor-
Examen Ordinario, el 56% de los estudiantes tantes.
se preparó en el Centro Preuniversitario de la Aquellos alumnos que hasta su cuarta ma-
Untels, el 35% de los estudiantes proviene de trícula aprobaron aproximadamente más de 30
una familia nuclear, el 89% de los estudiantes créditos, no desertaron. Se observan similares
proviene de una familia funcional, el 30% de comportamientos en las cuatro carreras. El atri-
los papás de los estudiantes son trabajadores buto Número de créditos aprobados hasta su
no calificados de los servicios, peones, vende- cuarta matrícula podría ser un atributo impor-
dores ambulantes y otros afines (chofer, taxista, tante sobre la deserción. Cabe explicar que los
zapatero, seguridad, entre otros), el 47% de las jóvenes que pertenecen a la carrera de Ingenie-
madres de los estudiantes se dedican a las labo- ría Ambiental son aquellos que han hecho tras-
res de ama de casa, no exceptuándose que mu- lado interno.
chas de ellas realizan alguna actividad en dicho La mayoría de desertores son aquellos que
ambiente como bodega, venta de productos de ingresaron en el año 2007 y 2008, cabe preci-
belleza, entre otros. En caso de enfermedad, el sar que la mayoría de estudiantes de las últimas
50% de los estudiantes se atiende en un área de promociones (2009, 2010, 2011) todavía no han
salud/posta médica, el 72% de los estudiantes concluido su periodo de estudios. Se sospecha
no cuenta con seguro de salud, el 81% de los que el atributo año de ingreso podría ser una
estudiantes se alimenta principalmente en su variable importante sobre la deserción.
hogar. Respecto a las variables de salud, todas Muchos de los estudiantes que ingresaron
ellas tienen como moda el «No presenta dicha a temprana edad no han desertado. La Edad de
enfermedad», tanto para el estudiante como ingreso podría ser un atributo a tener en cuenta.
para el familiar siendo el porcentaje más bajo El grupo de jóvenes que ingresaron en el año
81% y llegando en varios casos al 100%. El 2008 y pertenecen a la carrera profesional de
98% de los estudiantes no ha realizado traslado Ingeniería Ambiental, han hecho cambio de ca-
interno. rrera. Esta cambio podría ser el factor que hizo
Realizando un análisis exploratorio se en- que no deserten, sin embargo los casos registra-
contró que en la segunda matrícula un 6% ya dos a la fecha son pocos por lo que se sugiere
no se matriculó, el porcentaje es de 9% en la hacer el seguimiento.
tercera matrícula y de 12% en la cuarta matrí- El tipo de colegio no parece ser un factor
cula. En general, podemos decir que desde los relevante para la deserción puesto que se obser-
primeros ciclos se va percibiendo el fenómeno van comportamientos similares según tipo de
de la deserción estudiantil con una posible ten- colegio de procedencia. Al parecer los estudian-
dencia creciente. tes que ingresaron por la modalidad de Centro
Se encontró deserción en todos los estudian- Preuniversitario presentan menos deserción que
tes que en los cuatro semestres consecutivos a aquellos que ingresaron por otras modalidades,
su ingreso registraron solamente una matrícula; asimismo, aquellos jóvenes que no saben cuál
la mayoría de aquellos que en el mismo periodo es el grado de instrucción de sus papás tienden a

82 Untelsciencia-Perú. Enero 2016


M. MANCO CAYCHO

no desertar. Se observa que los estudiantes que la poda (C) fue de 0.25 y el mínimo número de
tienen menos de siete cursos aprobados hasta instancias permitido en cada hoja (M) fue de 2,
su cuarta matrícula, son candidatos a desertar. como resultado se obtuvo un árbol muy grande;
No se observan diferencias según semestre de con la finalidad de reducirlo se construyó el mo-
ingreso. delo Nº 6 con C=0.20 y M=12. Otros paráme-
No se puede decir que algún género en par- tros de configuración fueron: U: Use un árbol
ticular tenga mayor predisposición a desertar sin podar: Falso, R: Utilice error de poda redu-
que otro, ni que algún Tipo de familia en par- cido: Falso, N: Número de particiones: 10, B:
ticular genere mayor predisposición a desertar Cortes para las ramas binarios: Falso y Q: Se-
que otro. No se observan diferencias según si- milla para tomar los datos al azar: 1. Una vista
tuación laboral del estudiante. rápida (gráfica) del modelo Nº 6 se muestra en
Fase 3: Fase de minería de datos la Figura 1 y en la Figura 2 se muestra la vista
En esta fase se generaron los modelos. La del árbol en forma de texto, de donde con mu-
clasificación se realizó
mediante un árbol de
decisión con el ope-
rador Decision Tree
y la implementación
W-J48. Se crearon va-
rios árboles de prueba,
presentando un resu-
men de seis de ellos en
la Tabla 1.
El modelo Nº 5 se
construyó con los pa-
rámetros por defecto,
entre los cuales el um-
bral de confianza para Figura 1. Vista gráfica del Modelo Nº 6.

Tabla 1. Resumen de seis modelos trabajados

Descripción Operador Parámetros

Modelo Cadena de Validación


Decision Por
operadores cruzada W-J48 Modificados
Tree defecto
lineales nominal
Modelo 1 X X X

Modelo 2 X X X

Modelo 3 X X X

Modelo 4 X X X

Modelo 5 X X X

Modelo 6 X X X

Untels.cie.-Per. Vol. 1 Nº 1, pp. 79-90 83


Modelo predictivo para la identificación de patrones de la deserción estudiantil en la Untels

ca el árbol de decisiones. En este sexto modelo,


el algoritmo sólo ha seleccionado a ocho atribu-
tos independientes.
Fase 4: Evaluación e interpretación
a) Usando la precisión: La precisión para los
modelos Nº 1, 2, 3, 4, 5 y 6 fue de 91.01%,
90.60%, 89.45%+1.52%, 89.20% + 1.60%,
89.53%+2.26%, 90.10%+2.08% respecti-
vamente. El algoritmo Decision Tree, sin
validación cruzada, nos da un valor de la
precisión anormalmente alto porque pre-
senta sobreajuste, por eso lo descartamos.
El modelo con mayor precisión y por ende
el que tiene la menor tasa de error (9.9%) es
el modelo Nº 6, por lo que viene a constituir
la hipótesis más consistente.
b) Usando la medida F_Score: Las tasas F-sco-
re correspondientes al Modelo Nº 1, 2, 3, 4,
Figura 2. Texto del árbol W-J48-Modelo Nº 6. 5 y 6 son 0.7029972, 0.6902173, 0.6613756,
0.6597402, 0.7196468 y 0.7333333 respec-
tivamente. Encontramos que el modelo Nº
6 es el que tiene el mayor valor para F-sco-
cha facilidad se pueden extraer las reglas que
re, por lo que según este criterio es el mejor
formarán los patrones buscados. En la Tabla 2
modelo.
se presenta un resumen de las 9 hojas que abar-

Tabla 2. Resumen de instancias que cubre cada hoja del Modelo Nº 6

Clase N-E
Hoja N E E/N (N-E)/N Según los dos
Deserción (Correctos)
1 SÍ 148 18 130 12% 88% criterios anteriores,
encontramos que
2 NO 17.05 6.05 11 35% 65%
de entre los seis
3 SÍ 31.14 8.05 23.09 26% 74% modelos propues-
4 NO 21.75 2.75 19 13% 87% tos, el que tiene
5 SÍ 35.31 10 25.31 28% 72% mejor rendimiento
6 NO 21.61 4.45 17.16 21% 79% es el modelo Nº 6,
7 SÍ 12.31 5 7.31 41% 59% éste es el modelo
predictivo, que uti-
8 NO 65.02 0 65.02 0% 100% lizando técnicas de
9 NO 860.83 36.04 824.79 4% 96% minería de datos
Total 1213.02 90.34 1122.68 determina las ca-
racterísticas o pa-
Donde: trones del entorno
N: Suma de casos que llegan hasta la hoja. que impactan en la
E: Número de casos mal clasificados. deserción de los es-

84 Untelsciencia-Perú. Enero 2016


M. MANCO CAYCHO

tudiantes de la Untels. En orden de importan- encontró que los cuatro factores (socioeconómi-
cia se encontraron ocho atributos asociados a la cos, institucionales, individuales, académicos)
deserción estudiantil en la Untels: Número de en conjunto inciden sobre la deserción; coinci-
matrículas en los cuatro semestres consecutivos dimos en la importancia de la integración aca-
a su ingreso, Promedio en su segunda matrí- démica, con respecto al estudio de la ANUIES
cula, Edad de ingreso, Promedio en su cuarta (México) se comparte el hecho de la deserción
matrícula, Año de ingreso, Número de personas en los primeros años [2], uno de los elemen-
dependientes, Semestre de ingreso y Número de tos explicativos de la deserción enunciada por
cursos aprobados en su primera matrícula. El Romo y Fresán [2] es «la falta de personalidad
modelo conceptual obtenido a partir del modelo y madurez intelectual del estudiante» que de al-
Nº 6, se muestra en la Figura 3. guna manera equivale a la edad del ingresante,
por lo que coinci-
dimos en ese as-
pecto, los resulta-
dos de Lopera [28]
(Colombia) mues-
tran que los estu-
diantes de sexo
masculino, la vin-
culación de los es-
tudiantes al merca-
do laboral, la edad
y los estudiantes
provenientes de
otras regiones, tie-
nen mayor riesgo
de deserción. Sólo
coincidimos con la
edad.
Figura 3. Modelo Conceptual Final Con respecto
a la investigación titulada «Aplicación de téc-
nicas de minería de datos para predecir deser-
ción» [3], encontró que los alumnos desertan
Discusión por tres casusas principales: la edad, los ingre-
Margarita Latiesa de la Universidad de Gra- sos familiares para aquellos cuya edad sea me-
nada-España [22] incide en que la diferencia de nor o igual a 18 años y el nivel de inglés, para
deserción existente entre carreras es enorme, aquellos alumnos cuya edad sea mayor de 18
sobre todo es en el primer año donde se da la años. Coincidimos con el factor edad.
mayor tasa de abandono, éste segundo resultado Uno de los resultados más relevantes del
se observa también en nuestro estudio, Sanabria estudio de López, Gonzáles y otros (Repúbli-
(Perú) [23] concluye que el factor vocacional, ca Dominicana) es que existen diferencias en la
económico y académico son los factores de deserción según sexo y carreras. Ninguno de los
mayor peso sobre la deserción, respecto a ello resultados es similar al nuestro [14].
coincidimos con el factor académico, mas no En Colombia [30] la deserción se da so-
con el económico, en Colombia, Castaño [25] bre todo en el primer semestre, teniendo como

Untels.cie.-Per. Vol. 1 Nº 1, pp. 79-90 85


Modelo predictivo para la identificación de patrones de la deserción estudiantil en la Untels

principales causas, según SPADIES, la caren- • Social: Número de personas dependien-


cia de recursos económicos, el nivel académico tes (CARACTERÍSTICA FAMILIAR).
de los padres, los aspectos relacionados con el 2. El modelo predictivo que utiliza el algorit-
sostenimiento durante los estudios y el sexo, mo de árboles de decisión (W-J48) discri-
desertando más los hombres que las mujeres, mina con gran precisión si el estudiante es
nuestros resultados no coinciden con ninguno vulnerable a desertar. Se obtuvo un 70,21%
de estos aspectos, coincidimos con las estadís- de clasificación correcta para los desertores
ticas chilenas [8] en que al término del primer y un 94.892% de clasificación correcta para
año de estudios, un alto porcentaje de estudian- los no desertores. En general se logró un
tes deserta y el bajo rendimiento académico son 90.10% de clasificación correcta, con una
causas importantes de la deserción, sin embar- desviación estándar de 2.08%. El modelo
go a diferencia de estos resultados no observa- consta de nueve nodos terminales (hojas) y
mos prevalencia en los estudiantes de género su tamaño es de diecisiete.
masculino ni problemas económicos, nuestros 3. El modelo predictivo que utiliza el algorit-
resultados coinciden con Pinzón [31] en que la mo de árboles de decisión (W-J48) permitió
ciudad de residencia, el estado civil no son mo- detectar patrones diferentes para los deser-
tivos relevantes en la decisión de desertar, pero tores y los no desertores. Para los desertores
sí es sensible al bajo nivel académico. el principal patrón detectado es que el nú-
Fase 5: Difusión y uso mero de matrículas en los cuatro semestres
Una vez obtenido el modelo predictivo consecutivos a su ingreso sea menor o igual
mediante los árboles de decisión, es posible in- que 3. Este patrón representa una precisión
teractuar con el modelo construido, se requeri- de 88% en la predicción de que un estudian-
rá un archivo en MS EXCEL conteniendo los te deserte. Para los no desertores el modelo
datos de los estudiantes correspondientes a las detectó dos patrones principales, el primero
ocho variables seleccionadas. Éste archivo será es que el número de matrículas en los cua-
el repositorio que se carga en el RapidMiner. tro semestres consecutivos a su ingreso sea
Se tendrán las predicciones luego de ejecutar el mayor que 3 y el promedio en su segunda
modelo. matrícula sea mayor que 7.94 y el prome-
dio en su cuarta matrícula sea menor o igual
Conclusiones que 7.96 y el año de ingreso sea posterior a
1. El algoritmo de árboles de decisión (W-J48) 2009. Este patrón representa una precisión
permitió encontrar un modelo que detecta de 100% en la predicción de que un estu-
las características o patrones del entorno diante no deserte. El segundo patrón es que
que impactan en la deserción de los estu- si el número de matrículas en los cuatro se-
diantes de la Untels. Los patrones contienen mestres consecutivos a su ingreso es mayor
los siguientes atributos: que 3 y el promedio en su segunda matrícu-
• Académicos: Edad de ingreso (CARAC- la es mayor que 7.94 y el promedio en su
TERÍSTICA PREUNIVERSITARIA) y cuarta matrícula es mayor que 7.96. Este pa-
el Número de matrículas en los cuatro trón representa una precisión de 96% en la
semestres consecutivos a su ingreso, Pro- predicción de que un estudiante no deserte.
medio en su segunda matrícula, promedio
en su cuarta matrícula, año de ingreso, Referencias bibliográficas
semestre de ingreso, cursos aprobados en [1] Brunner JJ, Ferrada Hurtado R, editores.
su primera matrícula (CARACTERÍSTI- Educación superior en Iberoamérica-in-
CAS INSTITUCIONALES). forme 2011. Chile:RIL; 2011. Patrocinado

86 Untelsciencia-Perú. Enero 2016


M. MANCO CAYCHO

por el Centro Interuniversitario de Desarro- sil 2005-2009 Informe Nacional. [en línea]
llo (CINDA). Disponible en: http://www. Chile: Centro Interuniversitario de Desa-
cinda.cl/download/Brunner2011-Educa- rrollo; 2011 [accesado 7 Jul 2012]. Dispo-
cionSuperior.pdf [consulta: 7 Jul 2012] nible en: http://www.cinda.cl/htm/es.htm
[2] Huesca Ramírez MGE, Ramírez G, [8] Zapata G, Tejeda I, Rojas A, editores. Edu-
Castaño Corvo MB. Causas de deser- cación Superior en Chile 2005-2009. In-
ción de alumnos de primeros semestres forme nacional. [en línea] Chile: Centro
de una universidad privada. Rev Mex Interuniversitario de Desarrollo; 2011 [ac-
Orient Educ [en línea] 2007 Jul-Oct [ac- cesado 7 Jul 2012]. Disponible en: http://
cesado 6 Jul 2012]; V(12):[7 p.] Dispo- www.cinda.cl/htm/es.htm
nible en: http://164.73.2.147/alfaguia/ [9] Macaya Trejos G, Román Forastelli M, edi-
files/1319582164causas%20de%20deser- tores. Educación superior en Costa Rica
cion%20en%20una%20universidad%20 2005-2009. Informe nacional. [en línea]
privada.pdf Chile: Centro Interuniversitario de Desa-
[3] Valero Orea S, Salvador Vargas A, García rrollo; 2011 [accesado 7 Jul 2012]. Dispo-
Alonso M. Minería de datos: predicción de nible en: http://www.cinda.cl/htm/es.htm
la deserción escolar mediante el algoritmo [10] Duriez Gonzáles M, Coca Palacios L, edi-
de árboles de decisión y el algoritmo de los tores. Educación superior en El Salvador
k vecinos más cercanos. Recursos digitales 2005-2009. Informe nacional. [en línea]
para la Educación y la Cultura [en línea] Chile: Centro Interuniversitario de Desa-
2010 [accesado 10 Jul 2012]; KAAMBAL rrollo; 2011 [accesado 7 Jul 2012]. Dispo-
[7 p.] Disponible en: http://ccita2011.its- nible en: http://www.cinda.cl/htm/es.htm
motul.edu.mx/documentos/Recursos_digi- [11] Duriez González M, Sándigo Martínez C,
tales.pdf Coca Palacios L, editores. Educación supe-
[4] Observatorio Universitario de las Innova- rior en Guatemala 2005-2009. Informe na-
ciones [en línea]. México: Universidad de cional. [en línea] Chile: Centro Interuniver-
Colima; Nov 2006 [accesado 6 Jul 2012]. sitario de Desarrollo; 2011. [accesado 7 Jul
La deserción en la educación superior. Dis- 2012]. Disponible en: http://www.cinda.
ponible en: http://www.ucol.mx/observato- cl/htm/es.htm
rio/comunicados/Comunicado7.pdf [12] Duriez González M, Sándigo Martínez C,
[5] Espí Lacomba N, Cruz González E, Mar- editoras. Educación Superior en Honduras
tín Sabina E, Iñigo Bajos E, Tristá Pérez B, 2005-2009. Informe nacional. [en línea]
López Rodríguez A, et al, editores. Educa- Chile: Centro Interuniversitario de Desa-
ción superior en Cuba 2005-2009. Informe rrollo; 2011. [accesado 7 Jul 2012]. Dispo-
nacional. [en línea] Chile: Centro Interuni- nible en: http://www.cinda.cl/htm/es.htm
versitario de Desarrollo; 2011 [accesado 7 [13] De Escobar V, editora. Educación Superior
Jul 2012]. Disponible en: http://www.cin- en Panamá 2005-2009. Informe nacional.
da.cl/htm/es.htm [en línea] Chile: Centro Interuniversitario
[6] Pereira E, editor. Educación Superior en de Desarrollo; 2011. [accesado 7 Jul 2012].
Portugal 2005-2009. Informe Nacional. Disponible en: http://www.cinda.cl/htm/
[en línea] Chile: Centro Interuniversitario es.htm
de Desarrollo; 2011 [accesado 7 Jul 2012]. [14] López A, Mejía R, editores. Educación
Disponible en: http://www.cinda.cl/htm/ Superior en República Dominicana 2005-
es.htm 2009. Informe nacional. [en línea] Chile:
[7] Leal R, editor. Educación Superior en Bra- Centro Interuniversitario de Desarrollo;

Untels.cie.-Per. Vol. 1 Nº 1, pp. 79-90 87


Modelo predictivo para la identificación de patrones de la deserción estudiantil en la Untels

2011. [accesado 7 Jul 2012]. Disponible covery. 1998; 2(4): 345–89.


en: http://www.cinda.cl/htm/es.htm [22] Tipología y causas de la deserción univer-
[15] García de Fanelli A, editora. Educación sitaria y el retraso en los estudios. DIA-
Superior en Argentina 2005-2009. Informe LOGO Iberoamericano. Núm. 5 Sep-Oct
nacional. [en línea] Chile: Centro Interuni- 1996 [en línea]. Disponible en: http://dia-
versitario de Desarrollo; 2011. [accesado 7 logo.ugr.es/anteriores/dial05/11-5.htm/
Jul 2012]. Disponible en: http://www.cin- [23] Sanabria H. Deserción en estudiantes de
da.cl/htm/es.htm enfermería en cuatro universidades del
[16] Rodríguez Castro M, Zegarra Pellanne J, Perú. Anales de la Facultad de Medicina –
Díaz Garay B, Motta Ferreccio A, Cua- Universidad Nacional Mayor de San Mar-
dros Blas J, editores. Informe sobre el Sis- cos [en línea] 2002 [accesado 10 jul 2012]
tema de Educación Superior Universitaria 63(4). Disponible en: http://sisbib.unmsm.
del Perú. Lima: Centro Interuniversitario edu.pe/bvrevistas/anales/v63_n4/pdf/de-
de Desarrollo; 2009. Proyecto ALFA N° sercion_estudiantes.pdf
DCI-ALA-2008-42: Aseguramiento de la [24] Jiménez Galindo A, Álvarez García H. Mi-
Calidad: Políticas Públicas y Gestión Uni- nería de datos en la educación. Inteligencia
versitaria. [accesado 6 Jul 2012]. Disponi- en Redes de Comunicación. 2010.
ble en: http://www.cinda.cl/proyecto_alfa/ [25] Castaño E, Gallón S, Gómez K, Vásquez
download/informe_peru.pdf J. Deserción estudiantil universitaria:
[17] Del Mastro Vecchione C, editora. Educa- una aplicación de modelos de duración.
ción Superior en Perú 2005-2009. Informe [en línea]. Medellín: Lecturas de Econo-
nacional. [en línea] Chile: Centro Interuni- mía, Nº 60; Ene – Jun 2004. [accesado 6
versitario de Desarrollo; 2011. [accesado 7 Jul 2012] Disponible en: http://redalyc.
Jul 2012]. Disponible en: http://www.cin- uaemex.mx/src/inicio/ArtPdfRed.jsp?iC-
da.cl/htm/es.htm ve=155217798002
[18] Barrientos Z, Umaña R. Deserción estu- [26] Rodríguez Lagunas J, Hernández Vázquez
diantil en posgrados semipresenciales de la JM. La deserción escolar universitaria en
Universidad Estatal a Distancia (UNED), México. La experiencia de la Universidad
Costa Rica: ¿Deserción o retraso? [en lí- Autónoma Metropolitana Campus Iztapa-
nea] Costa Rica: Cuadernos de Investiga- lapa. [en línea] 30 de abril 2008 [accesado
ción UNED 1(2); Dic 2009 [accesado 7 Jul 21 Jul 2012]; 8(1): [30 p.] Disponible en:
2012] Disponible en: http://estatico.uned. http://revista.inie.ucr.ac.cr/uploads/tx_ma-
ac.cr/investigacion/publicaciones/cuader- gazine/deserc.pdf
no1/documents/Barrientos_Desercion.pdf [27] Díaz Peralta C. Modelo Conceptual para
[19] Sánchez Carlessi H, Reyes Meza C. Meto- la deserción estudiantil universitaria chile-
dología y diseños en la investigación cien- na. [en línea]. Chile: Estudios Pedagógicos
tífica: aplicados a la psicología, educación XXXIV Nº 2: 65-86; 2008 [accesado 6 Jul
y ciencias sociales. 1ª reimpresión corr. 2012].
Lima: [s.n.]; 1985. [28] Lopera Oquendo C. Determinantes de la
[20] Supo Condori J.A. Curso de Estadística deserción universitaria en la Facultad de
Minería de Datos para la Investigación Economía Universidad del Rosario. [en lí-
Científica; 2° grupo. Perú; marzo 2013. nea]. Colombia: Serie Documentos–Borra-
[21] Murthy S. Automatic construction of de- dores de Investigación Nº 95 Universidad
cision trees from data: a multidisciplinary del Rosario; 2008 [accesado 6 Jul 2012].
survey. Data Mining and Knowledge Dis- [29] Spositto OM, Etcheverry ME, Ryckeboer

88 Untelsciencia-Perú. Enero 2016


M. MANCO CAYCHO

HL, Bossero J. Aplicación de técnicas de dos, técnicas y aplicaciones. España: Mc-


minería de datos para la evaluación del Graw-Hill; 2008.
rendimiento académico y la deserción es- [37] Jiménez Moscovitz L. Un modelo concep-
tudiantil. [en línea] Buenos Aires: Univer- tual para el desarrollo de árboles de deci-
sidad Nacional de La Matanza; 2009 , [ac- sión con programación genética. [Trabajo
cesado 6 Jul 2012]. Disponible en: http:// para optar el título de Especialista en In-
www.iiis.org/CDs2010/CD2010CSC/CIS- formática y Ciencias de la Computación].
CI_2010/PapersPdf/CA156FK.pdf Bogotá: Fundación Universitaria Konrad
[30] Orozco Silva LE, Castillo Gómez LC, Roa Lorenz, 2007. Disponible en: http://www.
Varelo A, editores. Educación Superior en konradlorenz.edu.co/images/stories/articu-
Colombia 2005-2009 Informe Nacional. los/Leonardo_Jimenez_Moscovitz_Espe-
[en línea] Chile: Centro Interuniversitario cializacion.pdf
de Desarrollo; 2011. [accesado 7 Jul 2012]. [38] Williams G. Data mining with Rattle and
Disponible en: http://www.cinda.cl/htm/ R: the art of excavating data for knowledge
es.htm discovery. New York: Springer; 2011.
[31] Pinzón Cadena LL. Aplicando minería de [39] Witten IH, Frank E. Data mining: practi-
datos al marketing educativo Notas De cal machine learning tools and techniques.
Marketing [en línea] 2011 Ene-Jun [acce- 2ª ed. USA: The Morgan Kaufmann Publi-
sado 7 Jul 2012]; 1(1):45-61 Disponible en: shers; 2005.
http://www.usergioarboleda.edu.co/inves- [40] Silberschatz A, Korth HF, Sudarshan S.
tigacion-marketing/marketing/articulo5Mi- Fundamentos de bases de datos. 4ª ed. Ma-
neriaDatos.pdf drid: McGraw-Hill; 2002.
[32] Luan J. Aplicaciones de minería de datos [41] Mitchel T. Machine learning. New York:
en la educación superior. USA: IBM Cor- McGraw-Hill; 1997.
poration; 2010 May. Disponible en: ftp:// [42] Gil Albarrán G. Data mining: minería de
ftp.software.ibm.com/common/ssi/ecm/es/ datos y SQL. Lima: Megabyte; 2009.
imw14303eses/IMW14303ESES.PDF [ac- [43] Vieira Braga LP, Ortiz Valencia LI, Ramírez
cesado 4 Set 2013] Carbajal SS. Introducción a la minería de
[33] Instituto Nacional de Estadística e Infor- datos. Río de Janeiro: E-papers; 2009.
mática. II Censo Nacional Universitario [44] Schumaker RP, Solieman OK., Chen H.
2010: principales resultados. Lima, 2011. Sports data mining. USA: Springer; 2010;
Disponible en: http://www.inei.gob.pe/ p. 89-92 (Integrated Series in Information
[accesado 6 Jul 2012] Systems; 26).
[34] Castro Kikuchi L. Diccionario de ciencias [45] Rapid-i.com, RapidMiner [en línea]. Ale-
de la educación. Lima. Editorial CEGURO, mania: Rapid-i.com, 2004?; [accesado 31
2005. Ene 2013]. Disponible en: http://rapid-i.
[35] Rizzuto F. La deserción en la educación com
superior, motivos y medidas preventivas. [46] Krzysztof C, Witold P, Roman S, Lukasz
[Tesis de Licenciatura en Organización y K. Data mining: a knowledge discovery
Gestión Educativa]. Argentina: Universi- approach. New York: Springer; 2007.
dad Austral, Escuela de Educación; 2009. [47] Hernández Orallo J, Ramírez Quintana MJ,
Disponible en: http://web.austral.edu.ar/ Ferri Ramírez C. Introducción a la minería
descargas/escuela-educacion/tesis-Fla- de datos. España: Pearson; 2008.
via-Rizzuto.pdf [48] Díaz Martínez Z. Predicción de crisis em-
[36] Mira Mira J. Inteligencia artificial: méto- presariales en seguros no vida, median-

Untels.cie.-Per. Vol. 1 Nº 1, pp. 79-90 89


Modelo predictivo para la identificación de patrones de la deserción estudiantil en la Untels

te árboles de decisión y reglas de clasifi- [50] Liu B. Web data mining: exploring hyper-
cación. Madrid: Editorial Complutense; links, contents, and usage data. USA:
2007. Springer; 2007; p. 55 – 116 (Data-Centric
[49] Russell S, Norvig P. Inteligencia artificial. Systems and Applications)
México: Prentice-Hall; 1996.

90 Untelsciencia-Perú. Enero 2016

Você também pode gostar