Você está na página 1de 30

Taller Minera de datos aplicados

a la educacin
1 parte
Introduccin a la minera de datos
27 de junio de 2011
Mercedes Torrado
Departamento Mtodos de Investigacin y
Diagnstico en Educacin (MIDE)
Este trabajo cuenta con licenciade Creative Commons:

Minera de datos aplicados a la educacin est subjecta a una licencia de Reconocimiento-


NoComercial-SinObraDerivada 3.0 (CC BY-NC-ND 3.0)

Para citar la obra:


Torrado, M. (2011) Minera de datos aplicados a la educacin. Barcelona: Universidad de
Barcelona. Deposito Digital http://hdl.handle.net/2445/19862

Torrado, M. (2011) La Minera de datos en educacin (MDE)


Introduccin a la Minera de datos

INTRODUCCIN
CONCEPTO
PROCESO DE MINERA DE DATOS
EJEMPLOS
PROGRAMAS INFORMTICOS
OTRAS APLICACIONES

Torrado, M. (2011) La Minera de datos en educacin (MDE)


Introduccin a la Minera de datos

Los avances tecnolgicos en las ltimas


dcadas nos han facilitado enormemente el
acceso a grandes volmenes de datos.

La cantidad de informacin que manejamos hoy


en da nos obliga a abordar el estudio de los
datos/informacin desde una perspectiva
global y no parcelada

La preocupacin por disponer de


informacin suficiente para la toma de
decisiones.

Cmo podemos analizar tal cantidad de


informacin e identificar aquella que nos permita
tomar decisiones y mejorar?
Torrado, M. (2011) La Minera de datos en educacin (MDE)
Introduccin a la Minera de datos

En los aos 90 apareci el concepto DATA MINING.


Esta tcnica se vincul estrechamente con la direccin de empresas y en
concreto al marketing.

La minera de datos o Data Mining puede definirse


como una extraccin de informacin desconocida
no trivial y potencialmente til de una gran cantidad
de informacin

Bajo este trmino se engloban un conjunto de tcnicas de anlisis cuyo


objetivo es extraer conocimiento implcito de la base de datos.

Torrado, M. (2011) La Minera de datos en educacin (MDE)


Introduccin a la Minera de datos
DEFINICIN
El Data mining tambin es considerado como una tecnologa
emergente que parte, por un lado de las tcnicas estadsticas y por
otro de las tcnicas de inteligencia artificial Aluja, 2001 (1)
Estadstica se ha preocupado Inteligencia artificial ofrece
ms por la posible soluciones algortmicas a los
generalizacin de los resultados datos

La Minera de datos comprende un conjunto de tcnicas para la


descripcin y prediccin a partir de grandes masas de datos
(Viera et al., 2009: 12)
[1] TomsAluja en su artculo La minera de datos, entre la estadstica y la inteligencia artificial publicado en el 2001
en la revista QESTIIO (vol 25, 3, p 479-498) hace todo un repaso de los orgenes de la Minera de datos en
cuanto a los elementos correspondientes de la Estadstica y de la inteligencia artificial

Torrado, M. (2011) La Minera de datos en educacin (MDE)


Equivalencias de nomeclaturas entre la Estadstica y la
Inteligencia Artificial
(Aluja, 2001: 482)
Inteligencia artificial Estadstica
Red (network) Modelo
Ejemplos (patterns) Observaciones, individuos
Inputs, outputs, features Variables
Inputs Variables explicativas
Outputs, targets Variables de respuesta
Errores Residuos
Training, learning Estimacin
Funcin de error, coste Criterio de ajuste
Pesos, coef. sinpticos Parmetros
Aprendizaje supervisado Regresin, discriminacin
Aprendizaje no supervisado Clasificacin

Torrado, M. (2011) La Minera de datos en educacin (MDE)


Introduccin a la Minera de datos

Data mining se asocia a:

Minera predictiva Minera de datos para el


Usa principalmente descubrimiento del
tcnicas estadsticas conocimiento
Usa principalmente tcnicas de inteligencia
artificial

Triangulacin Knowedge Discovery in


estadstica Databases
(Torrado, 2007)
(KDD)
Torrado, M. (2011) La Minera de datos en educacin (MDE)
Torrado, M. (2011) La Minera de datos en educacin (MDE)
Introduccin a la Minera de datos

Proceso de Descubrimiento de Conocimiento de Bases de


Datos(KDD)
Las siglas KDD fue creada en 1995 para designar el conjunto de
procesos, tcnicas que propician el contexto en el cual la minera de
datos tendr lugar
(Viera et al., 2009)
Una posible definicin:
La integracin de un conjunto de reas que tienen como propsito la
identificacin de un conocimiento obtenido a partir de las bases de datos
que aporten informacin hacia la toma de decisiones

(Riquelme et al., 2006 )

Torrado, M. (2011) La Minera de datos en educacin (MDE)


Introduccin a la Minera de datos

La finalidad del KDD es:


Procesar automticamente grandes cantidades
DATO
de datos brutos
Identificar los patrones ms significativos y
relevantes INFORMACIN
Presentarlos como conocimiento apropiado
para satisfacer las metas del usuario
CONOCIMIENTO
Torrado, M. (2011) La Minera de datos en educacin (MDE)
Exploracin y Reconocimiento Evaluacin e
Fuente de Datos Pre-procesamiento transformacin de patrones interpretacin

Fuente de Muestreo
Transformacin Modelado Informes
datos Seleccin de datos
Bases de
datos Reducir variables / Clasificacin
Limpieza de dimensionalidad
Regresin
datos Creacin de
grupamiento
caractersticas A
Datos que no existen Asociacin
Generacin de variables
Datos no clasificados nuevas
Identificacin de
extremos

PREPARACIN DE LOS DATOS


EXPLOTACIN
EVALUACIN

PROCESO KDD y de MINERA DE DATOS


Torrado, M. (2011) La Minera de datos en educacin (MDE)
Exploracin y Reconocimiento Evaluacin e
Fuente de Datos Pre-procesamiento transformacin de patrones interpretacin

Fuente de
CLASIFICACIN Transformacin Modelado Informes
datos
de datos
Bases
La de
finalidad es crear un modelo para poder
datos Reducir variables / Clasificacin /
predecir la pertenencia a
Limpieza de un determinado
dimensionalidad
grupo
asociacin
datos Creacin de
EJEMPLO: caractersticas Regresin
Datos que no existen Agrupamiento
Diagnosticar alumnos de xito acadmico
Generacin de variables
Datos no clasificados nuevas
Identificacin de
PRUEBAS:extremos
rboles de decisiones, anlisis discriminantes,
etc..
EXPLOTACIN

PROCESO KDD y de MINERA DE DATOS


Torrado, M. (2011) La Minera de datos en educacin (MDE)
Exploracin y Reconocimiento Evaluacin e
Fuente de Datos Pre-procesamiento transformacin de patrones interpretacin

Fuente de
REGRESIN Muestreo
Transformacin Modelado Informes
datos Seleccin de datos
LaBases
finalidad
de es crear un modelo para poder
datos el valor de una variable dependiente
predecir Reducir variables / a Clasificacin
Limpieza de dimensionalidad /asociacin
partir de otras independientes
datos Creacin de Regresi n
caractersticas
EJEMPLO: Datos que no existen Generacin de variables
Agrupamiento
Datos no clasificados
Estimar el rendimiento acadmiconuevasdel primer ao
de carrera Identificacin de
extremos

PRUEBAS:
Regresin lineal, redes neuronales, regresin EXPLOTACIN
logstica, etc

PROCESO KDD y de MINERA DE DATOS


Torrado, M. (2011) La Minera de datos en educacin (MDE)
Exploracin y Reconocimiento Evaluacin e
Fuente de Datos Pre-procesamiento transformacin de patrones interpretacin

Fuente de Muestreo
AGRUPAMIENTO / SEGMENTACIN
Transformacin Modelado Informes
datos Seleccin de datos
Bases
La de
finalidad es crear un modelo para poder
datos Reducir variables / Clasificacin /
agrupar con caractersticas
Limpieza de similares
dimensionalidad asociacin
datos Creacin de Regresin
EJEMPLO: caractersticas
Datos que no existen Agrupamiento
Identificar perfiles de alumnos Generacin de variables
Datos no clasificados nuevas
Identificacin de
PRUEBAS:extremos
K-medias, Bietpico, etc..

EXPLOTACIN

PROCESO KDD y de MINERA DE DATOS


Torrado, M. (2011) La Minera de datos en educacin (MDE)
Exploracin y Reconocimiento Evaluacin e
Fuente de Datos Pre-procesamiento transformacin de patrones interpretacin

Fuente de LOS DATOS DEBEN SER (Viera et al., 2009)


Muestreo Informes
Transformacin Modelado
datos Seleccin de datos
Bases de
datos Precisin sin errores de medicin
Reducir variables / Clasificacin /
Consistencia
Limpieza de datos coherentes
dimensionalidad asociacin
datos Creacin de Regresin
Completos sin falta de atributos
Datos que no existen
caractersticas
Agrupamiento

Datos no clasificados Concernientes


Generacin de variables
Relevancia nuevas al problema
No redundancia Sin duplicar la misma
Identificacin de
extremos
informacin

PROCESO KDD y de MINERA DE DATOS


Torrado, M. (2011) La Minera de datos en educacin (MDE)
Introduccin a la Minera de datos
Algunas aplicaciones (Riquelme, 2006)
Comercio y banca
Segmentacin de clientes, previsin de ventas, anlisis de riesgos
Medicina y farmacia
Diagnstico de enfermedades y la efectividad de los tratamientos
Seguridad y deteccin de fraude
Reconocimiento facial, acceso a redes no permitidas,
Astronoma
Identificacin de nuevas estrellas y galaxias
Geologa, minera, agricultura y pesca
Identificacin de reas de uso para distintos cultivos o pesca, explotacin minera en base de datos
de imgenes de satlites
Ciencias ambientales
Identificacin de modelos de funcionamiento de ecosistemas naturales o artificiales
Ciencias sociales
Estudio de los flujos de opinin, identificar barrios con conflicto en funcin de valores socio-
demogrgicos

Torrado, M. (2011) La Minera de datos en educacin (MDE)


Introduccin a la Minera de datos
Algunas aplicaciones en Educacin MDE
En el mbito educativo la aplicacin de la minera de datos como
tcnica de anlisis se ubica en el entorno del sistema educativo y
en concreto en Educacin superior. Las base de datos que se
utilizan en los sistemas educativos permiten disponer de una gran
cantidad de informacin, tanto de los estudiantes, trabajadores,
departamentos, universidades, etc., por ejemplo la base de datos
UNEIX
La MDE tiene como objetivo obtener una mejor comprensin del proceso
de aprendizaje de los estudiantes y de su participacin global en el proceso,
orientado a la mejora de la calidad y rentabilidad del sistema educativo
(Winters, T, 2006)

Torrado, M. (2011) La Minera de datos en educacin (MDE)


Introduccin a la Minera de datos
Algunas aplicaciones en Educacin MDE
R. Alcover, J. Benlloch, P. Blesa, M. A. Calduch1, M. Celma, C. Ferri, J.
Hernndez-Orallo, L. Iniesta, J. Ms, M. J. Ramrez-Quintana, A. Robles,
J. M. Valiente, M. J. Vicent, L. R. Znica. (2007) Anlisis del
rendimiento acadmico en los estudios de informtica de la
Universidad Politcnica de Valencia aplicando tcnicas de minera de
datos. XIII Jornadas de enseanza universitaria de la informtica. Teruel.
Espaa (disponible internet)

Quiroga, E. (2008) Minera de datos en educacin superior aplicada a


un modelo de alerta acdmica. Chile

Valero, S. (2009) Aplicacin de la minera de datos para predecir la


desercin. Universidad tecnolgicva de IzcAarlgduenMosaetajemmoprolossvisuales

Torrado, M. (2011) La Minera de datos en educacin (MDE)


EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)

Torrado, M. (2011) La Minera de datos en educacin (MDE)


EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)

Torrado, M. (2011) La Minera de datos en educacin (MDE)


EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)

Torrado, M. (2011) La Minera de datos en educacin (MDE)


EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)

Torrado, M. (2011) La Minera de datos en educacin (MDE)


Introduccin a la Minera de datos

PROGRAMAS INFORMTICOS

En esta ltima dcada han aparecido una


serie de programas informticos que nos han
permitido analizar un gran volumen de datos

Sus diferencias radican en la presentacin e


implementacin. Pasan por las mismas etapas:
colecta de datos, depuracin y anlisis

Torrado, M. (2011) La Minera de datos en educacin (MDE)


Torrado, M. (2011) La Minera de datos en educacin (MDE)
Torrado, M. (2011) La Minera de datos en educacin (MDE)
Torrado, M. (2011) La Minera de datos en educacin (MDE)
Torrado, M. (2011) La Minera de datos en educacin (MDE)
Introduccin a la Minera de datos

Text Mining Internet Web Mining


Si bien es cierto que existe una gran Otra de las aplicaciones de la
cantidad de informacin almacenada en minera de datos consiste en
bases de datos, la existencia de un gran aplicar sus tcnicas a
volumen de documentos hace necesario documentos y servicios Web
aplicar algn tipo de sistema de (minera de Web) en concreto, el
anlisis. anlisis de datos por Internet
y on line.
El anlisis presenta un mayor nivel de
complejidad y de dimensiones en cuanto a
la categorizacin de texto y procesamiento cules son las pginas web
de lenguaje natural. La minera de texto o ms visitadas?
text mining permite la extraccin y
recuperacin de la informacin
PASW Text Mining (2010)

Torrado, M. (2011) La Minera de datos en educacin (MDE)


Bibliografa

Aluja, T (2001) La minera de datos, entre la estadstica y la inteligencia


artificial. QESTII, vol 25,3, p 479-498
Han, J. y Kamber, M. (2006) Data mining, concepts and techniques. USA
Hernandez Orallo J.L. (2004) Introduccin a la minera de datos. New York:
Pearson Prentice Hall
Prez, C. Santn, D. (2007) Minera de datos: tcnicas y herramientas. Madrid:
Paraninfo
Riquelme, J.C.; Ruiz, R y Gilbert, K. (2006) Minera de datos: conceptos y
tendencias. Revista Iberoamericana de Inteligencia artificial, 29, pp 11-18
Vieira Braga, L.P.; Ortiz Valencia, L.I.; Ramrez Carvajal, S.S. (2009)
Introduccin a La Minera de Datos. Rio de Janeiro: E-papers servicios
editoriales
Winters, T (2006) Educational Data Mining: Collection and Analysis of Score
Matrices for Outcomes- Based Assessment .USA, University of California:
Riverside

Torrado, M. (2011) La Minera de datos en educacin (MDE)


PASAMOS A LA SEGUNDA
PARTE ?
O
HACEMOS DESCANSO?

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Você também pode gostar