Escolar Documentos
Profissional Documentos
Cultura Documentos
Minera de datos es la
exploracin y anlisis de
grandes cantidades de datos
con el objeto de encontrar
patrones y reglas
significativas (conocimiento)
OBJETIVO
Extraer informacin de un conjunto de
datos y transformarla en una estructura
comprensible para su uso posterior
Anlisis automtico o semi-automtico de
grandes cantidades de datos para extraer
patrones interesantes hasta ahora
desconocidos, como los grupos de
registros de datos (anlisis clster),
registros poco usuales (la deteccin de
anomalas) y dependencias (minera por
reglas de asociacin)
MINERIA DE DATOS
KDDsenutredediferentesdisciplinas:
Estadstica.
Sistemasdeinformacin/basesdedatos.
Aprendizajeautomtico/InteligenciaArtificial.
Visualizacindedatos.
Computacinparalela/distribuida.
Interfacesdelenguajenaturalabasesdedatos.
Estadstic
a
Data Mining
Sistemas de
informacin
Aprendizaj
e
automtic
o
Otras
disciplinas
Almacn de
Datos
(Data
Warehouse)
Integracin y
recopilacin
Datos
seleccionado
s
Seleccin,
limpieza y
transformacin
DATA MINING
Patrone
s
Evaluacin e
interpretacin
Conocimient
o
Ventajas:
Generar un modelo requiere menos esfuerzo manual y permite
evaluar cantidades ingentes de datos.
Se pueden evaluar muchos modelos generados automticamente,
y esto aumenta la probabilidad de encontrar un buen modelo.
El analista necesita menos formacin sobre construccin de
modelos y menos experiencia.
Es potencialmente til
Tipos de aplicaciones de la
minera de datos
Clasificacin
Estimacin
Pronstico
Asociacin
Agrupacin o segmentacin
Clasificacin
Ejemplos:
Estimacin
Ejemplos:
Pronstico
Ejemplos:
Asociacin
Ejemplo:
Agrupacin o segmentacin
Ejemplo:
1.
2.
Histogramas
Diagramas de dispersin
Valores atpicos
etc.
3.
4.
5.
Extraccin de conocimiento:
6.
Pre procesamiento de los datos (prepara los datos para aplicar la tcnica de data
mining que mejor se adapte).
Usando el modelo predictivo se obtiene los valores de las variables, observando los
patrones de comportamiento.
Se debe comprobar que las conclusiones que arrojan los modelos predictivos sean
validas y suficientemente satisfactorias.
Redes neuronales
Regresin lineal
Arboles de decisin
Modelos estadsticos
Agrupamiento
Reglas de asociacin
Regresin lineal
Arboles de decisin
Modelos estadsticos
Agrupamiento
Reglas de asociacin
Conceptos clave