Você está na página 1de 3

Universidad del Cauca

Facultad de Ingeniera Electrnica y de Telecomunicaciones

UNIVERSIDAD DEL CAUCA


FACULTAD DE INGENIERIA ELECTRNICA Y TELECOMUNICACIONES
DEPARTAMENTO DE SISTEMAS

ASIGNATURA:
CODIGO:
MODALIDAD:
INTENSIDAD:
AREA:
PREREQUISITOS:
CREDITOS:
PROFESOR:

MINERIA DE DATOS
SIS827
PRESENCIAL TEORICO / PRACTICA
4 HORAS / SEMANA
INGENIERA APLICADA
NINGUNO
3
MAG. CARLOS ALBERTO COBOS LOZADA

OBJETIVO GENERAL
Este curso da a los participantes la posibilidad de conocer, comprender las tcnicas
bsicas de minera de datos y saber como se aplican en problemas concretos de
extraccin de conocimiento til para el anlisis y la toma de decisiones.

OBJETIVOS ESPECIFICOS
El estudiante al final del curso estar en capacidad de:
1. Entender los conceptos y la terminologa de las tcnicas de minera de datos.
2. Reconocer los beneficios del uso sistemtico de tcnicas de extraccin de
conocimiento para la obtencin de modelos y patrones predictivos o descriptivos.
3. Conocer las fases del Descubrimiento de Conocimiento de Bases de Datos y la
importancia de las mismas en el xito del proceso (en especial las de limpieza y
seleccin de datos).
4. Conocer las distintas tcnicas de aprendizaje automtico y estadsticas utilizadas en
minera de datos, su potencial, su coste computacional y sus limitaciones de
representacin y de inteligibilidad.
5. Elegir, para un problema concreto, qu tcnicas de minera de datos son ms
apropiadas.
6. Generar los modelos y patrones elegidos utilizando una herramienta o paquete de
minera de datos.
7. Evaluar la calidad de un modelo, utilizando tcnicas sencillas de evaluacin
(validacin cruzada).
8. Implementar un algoritmo de minera de datos especfico.
9. Conocer la problemtica especial de la minera sobre la Web (documentos textuales
e hipertextuales) y las tcnicas ms usadas.
10. Conocer los problemas abiertos en la investigacin de minera de datos.
11. Conocer los congresos y foros ms importantes, as como las redes, recursos, etc.,
relacionados

2007-05-02 Departamento de Sistemas - FIET

1/3

Universidad del Cauca


Facultad de Ingeniera Electrnica y de Telecomunicaciones

METODOLOGIA
1. El estudiante adquirir los conocimientos bsicos a travs de clases magistrales
acompaadas de ejercicios prcticos.
2. El estudiante deber profundizar sus conocimientos con temas complementarios
desarrollando talleres prcticos y trabajos de investigacin.
3. El estudiante aplicar los conceptos tericos mediante el desarrollo de talleres
dirigidos que se realizarn en las horas prcticas.
4. El estudiante desarrollar prcticas de laboratorio y exposiciones de temas
complementarios o de profundizacin al contenido de la asignatura.
5. El estudiante implementar por lo menos un algoritmo de minera de datos durante
el desarrollo del curso.

CONTENIDO
1 INTRODUCCIN A LA MINERA DE DATOS (4 h)
1.1 Definicin.
1.2 Motivacin.
1.3 Problemas tipo y aplicaciones.
1.4 Relacin con otras disciplinas.
2 EL PROCESO KDD (8 h)
2.1 Fases del KDD
2.2 Tipologa y tcnicas de Minera de Datos
2.3 Sistemas Comerciales
2.4 Visualizacin
3 TCNICAS DE MINERA DE DATOS (30 h)
3.1
El problema de la extraccin automtica de conocimiento.
3.1.1 Pre-procesamiento de datos y anlisis exploratorio de los datos
3.1.2 Enfoques estadsticos de estimacin y prediccin
3.2
Evaluacin de Hiptesis
3.3
Tcnicas supervisadas y no supervisadas
3.3.1 Clasificacin: K-NN, Naive Bayes, rboles de decisin (C4.5, C5.0, CART)
3.3.2 Clustering: K-means, SOM (Self-Organizing Maps) o Redes Kohonen
3.3.3 Estimacin y Prediccin: Redes Neuronales (Perceptron y Perceptron multicapa)
3.3.4 Anlisis de asociacin: aprioriAll, aprioriSome, DynamicSome, FPGrow
3.4
Tcnicas de evaluacin de modelos
4 MINERA DE DATOS EN LA WEB WEBMINING (12 h)
4.1 Los Problemas de la Informacin No Estructurada
4.2 Extraccin de Conocimiento a partir de Documentos HTML y texto.
4.3 Extraccin de Informacin semi-estructurada (XML).
5 REAS DE INTERES EN INVESTIGACIN (6 h)
5.1 Problemas concretos.
5.2 Congresos, foros, redes y recursos

EVALUACIONES
2007-05-02 Departamento de Sistemas - FIET

2/3

Universidad del Cauca


Facultad de Ingeniera Electrnica y de Telecomunicaciones

Se realizarn tres (3) evaluaciones de la siguiente forma:


CORTE

Primer

35%

Segundo

35%

Tercero

30%

COMPONENTES
Descripcin
Parcial escrito
Quices, Talleres y/o Laboratorios
Parcial escrito
Quices, Talleres y/o Laboratorios
Parcial escrito
Quices, Talleres y/o Laboratorios

%
80%
20%
70%
30%
70%
30%

Las practicas, talleres y laboratorios en grupo sern evaluados individualmente y deben


estar debidamente documentados. Todo Proyecto NO sustentado pierde validez. Las
sustentaciones sern programadas con anterioridad definiendo fecha y hora para cada
alumno.

BIBLIOGRAFA

Larose, Daniel T. Data Mining Methods and Models. Daniel T. Larose. ISBN: 0-47175647-4. E-Book. 385 pages. February 2006, Wiley-IEEE Press.
Larose, Daniel T. Discovering Knowledge in Data: An Introduction to Data Mining.
Hoboken, NJ, USA: John Wiley & Sons, Incorporated, 2005. E-Book.
Data Mining with SQL Server 2005. ZhaoHui Tang, Jamie Maclennan. Wiley
Publishing, Indiana, 2005.
Kantardzic, Mehmed. Data Mining: Concepts, Models, Methods, and Algorithms,
John Wiley & Sons 2003 (343 pages). ISBN: 0471228524.
Anlisis y Extraccin de Conocimiento en Sistemas de Informacin: Datawarehouse
y Datamining. Departamento de Sistemas Informticos y Computacin. Universidad
Politcnica de Valencia. http://www.dsic.upv.es/~jorallo/cursoDWDM.
Wang, John (Editor). Data Mining: Opportunities and Challenges. Hershey, PA,
USA: Idea Group Inc., 2003.
Scime, Anthony. Web Mining: Applications and Techniques. Hershey, PA, USA: Idea
Group Publishing, 2004.
Hsu, Hui-Huang. Advanced Data Mining Technologies in Bioinformatics. Idea Group
Publishing. 2006. ISBN: 1-59140-865-2.
Berry, Michael J. A.; Linoff, Gordon S. Data Mining Techniques: For Marketing,
Sales, and Customer Relationship Management. John Wiley & Sons, Incorporated.
2004. ISBN: 0-471-47064-3.
Last, Mark; Kandel, Abraham; Bunke, Horst. Data Mining in Time Series Databases.
World Scientific Publishing Company, Incorporated. 2004. ISBN: 9-81-238290-9.

2007-05-02 Departamento de Sistemas - FIET

3/3

Você também pode gostar