Você está na página 1de 11

Algoritmos de minera de

datos (Analysis Services:


Minera de datos)


Un algoritmo de minera de
datos
O Es un conjunto de clculos y reglas
heursticas que permite crear un modelo de
minera de datos a partir de los datos. Para
crear un modelo, el algoritmo analiza primero
los datos proporcionados, en busca de tipos
especficos de patrones o tendencias.
O El algoritmo usa los resultados de este
anlisis para definir los parmetros ptimos
para la creacin del modelo de minera de
datos. A continuacin, estos parmetros se
aplican en todo el conjunto de datos para
extraer patrones procesables y estadsticas
detalladas.

O El modelo de minera de datos que crea un
algoritmo a partir de los datos puede tomar
diversas formas, incluyendo:
O Un conjunto de clsteres que describe cmo se
relacionan los casos de un conjunto de datos.
O Un rbol de decisin que predice un resultado y
que describe cmo afectan a este los distintos
criterios.
O Un modelo matemtico que predice las ventas.
O Un conjunto de reglas que describen cmo se
agrupan los productos en una transaccin, y las
probabilidades de que dichos productos se
adquieran juntos.


O proporciona varios algoritmos que puede usar en las
soluciones de minera de datos. Estos algoritmos son
implementaciones de algunas de las metodologas ms
conocidas usadas en la minera de datos. Todos los
algoritmos de minera de datos de Microsoft se pueden
personalizar y son totalmente programables, bien mediante
las API proporcionadas o bien mediante los componentes
de minera de datos de SQL Server Integration Services.
O Tambin puede usar algoritmos de minera de datos
desarrollados por terceros que cumplan la especificacin
OLE DB para minera de datos, o desarrollar algoritmos
personalizados que se pueden registrar como servicios
para usarlos a continuacin en el marco de la minera de
datos de SQL Server.

Microsoft SQL Server Analysis
Services
Elegir un algoritmo por tipo

Analysis Services incluye los siguientes tipos de algoritmos:
O Algoritmos de clasificacin, que predicen una o ms variables
discretas, basndose en otros atributos del conjunto de datos.
O Algoritmos de regresin, que predicen una o ms variables
continuas, como las prdidas o los beneficios, basndose en otros
atributos del conjunto de datos.
O Algoritmos de segmentacin, que dividen los datos en grupos, o
clsteres, de elementos que tienen propiedades similares.
O Algoritmos de asociacin, que buscan correlaciones entre
diferentes atributos de un conjunto de datos. La aplicacin ms
comn de esta clase de algoritmo es la creacin de reglas de
asociacin, que pueden usarse en un anlisis de la cesta de
compra.
O Algoritmos de anlisis de secuencias, que resumen secuencias o
episodios frecuentes en los datos, como un flujo de rutas web.

Sin embargo, no hay ninguna razn por la que deba limitarse a un
algoritmo en sus soluciones. Los analistas experimentados usarn a
veces un algoritmo para determinar las entradas ms eficaces (es
decir, variables) y luego aplicarn un algoritmo diferente para predecir
un resultado concreto basado en esos datos.

La minera de datos de SQL Server le permite generar varios modelos
en una nica estructura de minera de datos, por lo que en una
solucin de minera de datos puede usar un algoritmo de clsteres, un
modelo de rboles de decisin y un modelo de Bayes nave para
obtener distintas vistas de los datos.

Tambin puede usar varios algoritmos dentro de una nica solucin
para realizar tareas independientes: por ejemplo, podra usar la
regresin para obtener predicciones financieras, y un algoritmo de red
neuronal para realizar un anlisis de los factores que influyen en las
ventas.
Ejemplos de tareas
Predecir un atributo discreto
O Marcar los clientes de una lista de
posibles compradores como clientes con
buenas o malas perspectivas.
O Calcular la probabilidad de que un
servidor genere un error en los prximos
6 meses.
O Clasificar la evolucin de los pacientes y
explorar los factores relacionados.

Predecir un atributo continuo

O Pronosticar las ventas del ao prximo.
O Predecir los visitantes del sitio a partir de
tendencias histricas y estacionales
proporcionadas.
O Generar una puntuacin de riesgo a partir
de datos demogrficos.

Predecir una secuencia

O Realizar un anlisis clickstream del sitio
web de una empresa.

O Analizar los factores que dan como
resultado errores en el servidor.
O Capturar y analizar secuencias de
actividades durante las visitas de
pacientes externos, para formular las
prcticas recomendadas en las
actividades comunes.

Buscar grupos de elementos
comunes en las transacciones

O Usar el anlisis de la cesta de la compra
para determinar la posicin del producto.
O Sugerir a un cliente la compra de
productos adicionales.
O Analizar los datos de una encuesta a los
visitantes a un evento, para descubrir qu
actividades o stands estaban
correlacionados con el fin de programar
actividades futuras.

Buscar grupos de elementos
similares

O Crear grupos de pacientes con perfiles de
riesgo en funcin de atributos como datos
demogrficos y comportamientos.
O Analizar usuarios mediante patrones de
bsqueda y compra de productos.
O Identificar servidores con caractersticas
de uso similares.

Você também pode gostar