Você está na página 1de 9

TUTORIAL UTILIZANDO COMPLEMENTO MINERIA DE DATOS EXCEL 2013

Cristian Salazar C.

1. Ir a la pgina de Microsoft y descargar Complementos de minera de datos


de Microsoft SQL Server 2012 para Microsoft Office 2010 /2013

A continuacin est el link:

http://www.microsoft.com/es-es/download/details.aspx?id=29061

Es importante saber que este complemento solo funcionar en Microsoft


office 2010/2013

Clic en el botn descargar


Elegir entre las versiones de 32 o 64 bits dependiendo de sistema
operativo del PC
Descargar el complemento
Instalar el complemento

Despus de que el complemento est instalado en Microsoft Excel se habilitara


una pestaa llamada Minera de datos.

Clic en inicio, buscar: Complementos Minera de datos de SQL


Server 2012 para datos de ejemplo de Office 2010
Abrir el archivo: Datos de Excel de Ejemplo
2. A continuacin ir a la pestaa: Fill for example

Clic en la pestaa de minera de datos


Se muestra una tabla con informacin de 246 personas
Clic en explorar datos aparece la siguiente ventada:

Clic en siguiente
Seleccionar la opcin tabla y elegir la tabla Fill for example
En seleccionar columna elegir la opcin Age como lo muestra la
imagen:
Clic en siguiente
Donde dice depsitos modificar el valor a 4
Se crearn 4 rangos en los cuales se incluirn las edades de las 246 personas
de la lista como lo muestra la imagen:
Clic en agregar nueva columna
Clic en finalizar
En la tabla se crear una nueva columna al lado de la columna Age
en la cual en frente de cada edad de cada persona est el rango
de edad en el que pertenece.

3. Ir a la hoja source data

Clic en la pestaa de minera de datos


Clic en el boton datos de muestra, aparece el siguiente recuadro:
Clic en siguiente
Llenar el botn tabla y elegir la hoja source data
Clic en siguiente
Seleccionar muestreo para equilibrar distribucin de datos
Clic en siguiente

Con el muestreo para equilibrar la distribucin de datos se pretende generar una


muestra de 500 personas en la que haya 40% de clientes de gnero femenino y
60% de gnero masculino. Para lograr esto re realiza lo siguiente:

En la columna de entrada seleccionar Gender


En estado de destino seleccionar female
En porcentaje de destino poner 40
En tamao de la muestra poner 500
Aparecer la siguiente descripcin: Se extraer un conjunto de filas
de muestra a la nueva hoja de clculo. La muestra tendr como
mximo 500 filas y asegurar una representacin del 40% del
estado de destino.
Clic en siguiente
Modificar nombre de hoja de conjunto de muestra y escribir:
muestra 40 60
La nueva hoja que se crea tiene una muestra de 500 clientes en
los cuales el 40 % son mujeres y el 60 % son hombres.

4. A continuacin se van a eliminar los valores atpicos de una base de


datos, los valores atpicos son los que no son muy comunes por ende no
se repiten muchas veces, estos valores pueden alterar la media de los
clientes de manera significativa, en este caso se van a eliminar los
extremos de los rangos de edad que no se repiten tanto. Para hacer esto
hay que realizar lo siguiente:

Clic en la hoja: tabla analysis tolos sample


Clic en la pestaa minera de datos
Clic en el botn limpiar datos
Clic en valores atipicos
Clic en siguiente
En tabla seleccionar: tabla analysis tolos sample
Clic en siguiente
Seleccionar columna Age
Clic en siguiente
En el mximo escribir 71
Aparecer lo siguiente:

Se puede observar que la persona mayor de la base de datos tiene 89 aos pero
las personas que tienen 71 aos o menos son las que se repiten con mayor
frecuencia entonces se van a eliminar las personas entre 72 y 89 aos
Clic en siguiente
Clic en eliminar filas que contengan valores atpicos
Clic en siguiente
Clic en copiar datos con cambios en a una nueva hoja de calculo
Clic en siguiente
Se crea una nueva hoja que se llama limpiar datos, donde no hay
personas en el rango de edad entre 72 y 89 aos

Você também pode gostar