Você está na página 1de 15

Mineria de Datos

CONOCIMIEN
TO
INFORMACI
N
DATOS

Introduccin a la minera de
datos

Que es minera de datos?


Definiciones
Proceso de extraccin de informacin y patrones de
comportamientos que permanecen ocultos entre grandes
cantidades de informacin.
Proceso que a travs del descubrimiento y cuantificacin
de relaciones predictivas en los datos, permite
transformar la informacin disponible en conocimiento
til.

Informaci
n

Conocimiento
til

Relaciones

Patrones ocultos

Patrones de comportamiento en la
minera de datos?

Por que es necesario la mineria de


datos?
Las empresas de todos los tamaos necesitan
aprender de sus datos para crear una relacin
one-to-one con sus clientes.
Las empresas recogen datos de todos sus
procesos.
Los datos obtenidos se deben analizar,
comprender y convertir en Informacin con la
que se pueda actuar y aqu es donde Data Mining
juega su papel.

Tendencias en el manejo de
flujo de informacin
Ms informacin estn siendo generados:
Banca,
telecomunicaciones,
otras
transacciones
empresariales ...
Informacin cientfica: astronoma, biologa, etc
Web, texto, y comercio electrnico

Las bases de datos ms grande


del mundo
AT & T, la compaa de telecomunicaciones
323 terabytes de informacin
1900000000000 registros de llamadas
telefnicas
100 millones de videos vistos por da
65,000 videos agregados por da
Tiene el 60% de los videos que hay en lnea Al menos 45
terabytes de videos
59 millones de clientes activos
Ms de 42 terabytes de datos
National Energy Research Scientific Computing Center
2.8 petabytes de datos
Es operada por ms de 2,000 cientficos

Ejemplos de Aplicacin de la
minera de datos
Estimando
Situacin:
Una
solicita un prstamo
Tarea: Debera el
aprobar el prstamo?

persona

banco

Nota:
Personas con los mejores
crditos
no
necesitan
de
prstamos, y personas con los
peores
crditos
no
son
confiables de pagar deudas.
Los mejores clientes del banco
estn en trmino medio.

Los
bancos
desarrollan
modelos de crditos usando
una variedad de mtodos de
aprendizaje de mquina. (S.E.
Sistemas Calificacin, KMV)
La proliferacin de tarjetas de
crdito es el resultado de ser
capaces
de
predecir
exitosamente si una persona
tiene capacidad de pago.
Ampliamente
varios pases

difundido

en

Ejemplos de Aplicacin de la
minera de datos
Comercio Electronico:

Una persona
Amazon.com

compra

un

libro

(producto)

en

Cul es la tarea?

Tarea: Recomendar otros libros (productos) que esta


persona gustara comprar
Amazon realiza la seleccin de acuerdo a libros
comprados:
Clientes que compraron Advances in Knowledge
Discovery and Data Mining, tambin compraron
Data Mining: Practical Machine Learning Tools
and Techniques with Java Implementations

Minera de Datos: reas de


aplicacin
Ciencia
astronoma, bioinformtica, descubrimiento de drogas,

Negocios
CRM (Customer Relationship management), deteccin

de fraudes, comercio electrnico (e-commerce),


produccin,
deporte/entretenimiento,
telecomunicaciones, marketing dirigido, cuidado de la
salud,

Web:
motores de bsqueda, publicidad, minera en la web y

texto,

Gobierno
Seguimiento de documentos, deteccin de fraudes,

Tareas de la minera de datos


Clasificacin
Aprender un mtodo para predecir la clase de un elemento a
partir de instancias pre-definidas (clasificadas)

Por ejemplo, un problema tpico


de clasificacin es el de dividir
una base de datos de bancos en
grupos
que
sean
lo
ms
homogneos
posibles
con
respecto
a
variables
como
posibilidades de
crdito en
trminos de valores tales como
bueno o malo.

Tareas de la minera de datos


Clustering (Agrupacin)
Encontrar el natural agrupamiento de instancias
dada informacin no identificada

Por ejemplo, una empresa


quiere
introducirse
en
el
mercado de bebidas alcohlicas,
pero antes hace una encuesta
de mercado para averiguar si
existen grupos de clientes con
costumbres particulares en el
consumo de bebidas.

Tareas de la minera de datos


Asociaciones:
las observaciones son usadas para identificar asociaciones entre
variables.

Tareas de la minera de datos


Patrones secuenciales:
Se trata de identificar patrones de comportamiento y tendencias.
Por ejemplo, un distribuidor especializado en sistemas al aire libre
puede predecir la probabilidad de compra de una mochila basado
en la compra de un consumidor de sacos de dormir y calzado de
senderismo.

Algoritmos para Minera de


Datos
Los modelos de minera de datos pueden predecir valores,
generar resmenes de datos y buscar correlaciones ocultas.
Tarea

Algoritmos de Microsoft que se pueden


usar

Predecir un atributo discreto.


Por ejemplo, predecir si el destinatario de una
campaa de envo de correo directo adquirir un
producto.

Algoritmo
Algoritmo
Algoritmo
Algoritmo

Predecir un atributo continuo.


Por ejemplo, prever las ventas del ao prximo.

Algoritmo de rboles de decisin


Algoritmo de serie temporal

Predecir una secuencia.


Por ejemplo, realizar un anlisis clickstream del sitio
web de una empresa.

Algoritmo de agrupacin en clsteres de


secuencia

Buscar grupos de elementos comunes en las


transacciones.
Por ejemplo, utilizar el anlisis de la cesta de la
compra para sugerir a un cliente la compra de
productos adicionales.

Algoritmo de asociacin
Algoritmo de rboles de decisin

de rboles de decisin
Bayes naive
de clsteres
de red neuronal

Buscar grupos de elementos similares.


Algoritmo de clsteres
Por ejemplo, segmentar datos demogrficos en grupos Algoritmo de agrupacin en clsteres de
para comprender mejor las relaciones entre atributos. secuencia

Você também pode gostar