Un algoritmo de minera de datos O Es un conjunto de clculos y reglas heursticas que permite crear un modelo de minera de datos a partir de los datos. Para crear un modelo, el algoritmo analiza primero los datos proporcionados, en busca de tipos especficos de patrones o tendencias. O El algoritmo usa los resultados de este anlisis para definir los parmetros ptimos para la creacin del modelo de minera de datos. A continuacin, estos parmetros se aplican en todo el conjunto de datos para extraer patrones procesables y estadsticas detalladas.
O El modelo de minera de datos que crea un algoritmo a partir de los datos puede tomar diversas formas, incluyendo: O Un conjunto de clsteres que describe cmo se relacionan los casos de un conjunto de datos. O Un rbol de decisin que predice un resultado y que describe cmo afectan a este los distintos criterios. O Un modelo matemtico que predice las ventas. O Un conjunto de reglas que describen cmo se agrupan los productos en una transaccin, y las probabilidades de que dichos productos se adquieran juntos.
O proporciona varios algoritmos que puede usar en las soluciones de minera de datos. Estos algoritmos son implementaciones de algunas de las metodologas ms conocidas usadas en la minera de datos. Todos los algoritmos de minera de datos de Microsoft se pueden personalizar y son totalmente programables, bien mediante las API proporcionadas o bien mediante los componentes de minera de datos de SQL Server Integration Services. O Tambin puede usar algoritmos de minera de datos desarrollados por terceros que cumplan la especificacin OLE DB para minera de datos, o desarrollar algoritmos personalizados que se pueden registrar como servicios para usarlos a continuacin en el marco de la minera de datos de SQL Server.
Microsoft SQL Server Analysis Services Elegir un algoritmo por tipo
Analysis Services incluye los siguientes tipos de algoritmos: O Algoritmos de clasificacin, que predicen una o ms variables discretas, basndose en otros atributos del conjunto de datos. O Algoritmos de regresin, que predicen una o ms variables continuas, como las prdidas o los beneficios, basndose en otros atributos del conjunto de datos. O Algoritmos de segmentacin, que dividen los datos en grupos, o clsteres, de elementos que tienen propiedades similares. O Algoritmos de asociacin, que buscan correlaciones entre diferentes atributos de un conjunto de datos. La aplicacin ms comn de esta clase de algoritmo es la creacin de reglas de asociacin, que pueden usarse en un anlisis de la cesta de compra. O Algoritmos de anlisis de secuencias, que resumen secuencias o episodios frecuentes en los datos, como un flujo de rutas web.
Sin embargo, no hay ninguna razn por la que deba limitarse a un algoritmo en sus soluciones. Los analistas experimentados usarn a veces un algoritmo para determinar las entradas ms eficaces (es decir, variables) y luego aplicarn un algoritmo diferente para predecir un resultado concreto basado en esos datos.
La minera de datos de SQL Server le permite generar varios modelos en una nica estructura de minera de datos, por lo que en una solucin de minera de datos puede usar un algoritmo de clsteres, un modelo de rboles de decisin y un modelo de Bayes nave para obtener distintas vistas de los datos.
Tambin puede usar varios algoritmos dentro de una nica solucin para realizar tareas independientes: por ejemplo, podra usar la regresin para obtener predicciones financieras, y un algoritmo de red neuronal para realizar un anlisis de los factores que influyen en las ventas. Ejemplos de tareas Predecir un atributo discreto O Marcar los clientes de una lista de posibles compradores como clientes con buenas o malas perspectivas. O Calcular la probabilidad de que un servidor genere un error en los prximos 6 meses. O Clasificar la evolucin de los pacientes y explorar los factores relacionados.
Predecir un atributo continuo
O Pronosticar las ventas del ao prximo. O Predecir los visitantes del sitio a partir de tendencias histricas y estacionales proporcionadas. O Generar una puntuacin de riesgo a partir de datos demogrficos.
Predecir una secuencia
O Realizar un anlisis clickstream del sitio web de una empresa.
O Analizar los factores que dan como resultado errores en el servidor. O Capturar y analizar secuencias de actividades durante las visitas de pacientes externos, para formular las prcticas recomendadas en las actividades comunes.
Buscar grupos de elementos comunes en las transacciones
O Usar el anlisis de la cesta de la compra para determinar la posicin del producto. O Sugerir a un cliente la compra de productos adicionales. O Analizar los datos de una encuesta a los visitantes a un evento, para descubrir qu actividades o stands estaban correlacionados con el fin de programar actividades futuras.
Buscar grupos de elementos similares
O Crear grupos de pacientes con perfiles de riesgo en funcin de atributos como datos demogrficos y comportamientos. O Analizar usuarios mediante patrones de bsqueda y compra de productos. O Identificar servidores con caractersticas de uso similares.