Você está na página 1de 40

Sistemas de Datos

Data warehouse y Business Intelligence

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Esquema de la clase

1. Los tres problemas del OLTP

2. Qu es Data warehouse y Business Intelligence ? 5. Construccin de la solucin

3. La arquitectura de la solucin.

4. Las herramientas del BI

6. Casos de aplicacin

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Los tres problemas del OLTP


Nivel Estratgico
INFORMACION PARA LA TOMA DE DECISIONES PROBLEMAS Informacin no integrada. Inadecuados tiempos de respuesta. Imposibilidad de realizar consultas adhoc amigables.

Nivel Tctico Nivel Operativo


Compras

Ventas Sucursal Rosario Ventas Sucursal Bs.As.

...
Ventas Sucursal Crdoba

Produccin

Marketing

+ las n unidades de negocio

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Los tres problemas del OLTP


Ganancia bruta de los productos vendidos en Rosario respecto de Crdoba en el ltimo ao de los 10 productos que ms se produjeron los ltimos 6 meses. Establecer relacin con sus respectivas cantidades de habitantes.

INFORMACION NO INTEGRADA
Importe vendido $.5.000.000 Importe vendido $.6.000.000

Nivel Estratgico

Importe vendido $.8.000.000 Habitantes por ciudad

Nivel Operativo
Compras

Ventas Sucursal Rosario Ventas Sucursal Bs.As. Ventas Sucursal Crdoba

Produccin

Marketing

Finanzas

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Los tres problemas del OLTP


INADECUADOS TIEMPOS DE RESPUESTA.
Importe y cantidad vendida de los productos de indumentaria durante octubre y diciembre de los tres ltimos aos para los clientes de sexo femenino

Nivel Estratgico

Nivel Operativo
Ventas Sucursal Bs.As.

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Los tres problemas del OLTP


CONSULTAS AD-HOC NO AMIGABLES

Obtener la Cantidad de ventas realizadas, y sus importes agrupadas por ao y zona del cliente para los aos 2002 al 2006. SELECT COUNT(DISTINCT VENTA.Numero_factura) AS CANTIDAD_VENTAS, SUM(ITEM_VENTA.Cantidad_vendida * ITEM_VENTA.Precio_unitario) AS IMPORTE, CLIENTE.zona AS ZONA, YEAR(VENTA.fecha_venta) AS ANIO FROM VENTA INNER JOIN ITEM_VENTA ON VENTA.Numero_factura = ITEM_VENTA.Numero_factura INNER JOIN CLIENTE ON VENTA.Codigo_cliente = CLIENTE.Codigo_cliente GROUP BY CLIENTE.zona, YEAR(VENTA.fecha_venta) HAVING YEAR(VENTA.fecha_venta) in (2002, 2003, 2004, 2005, 2006) ORDER BY YEAR(VENTA.fecha_venta), CLIENTE.zona

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Qu es Data warehouse y Business Intelligence


Herramientas de BI
Datamining OLAP Tableros Reporting...
Nivel Estratgico
INFORMACION PARA LA TOMA DE DECISIONES

Nivel Tctico Nivel Operativo

Ventas Sucursal Crdoba Ventas Sucursal Bs.As.

...
Ventas Sucursal Crdoba

Produccin

DATA WAREHOUSE

Compras

Marketing

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

La arquitectura de la solucin
rea del Data warehouse
Transformacin
Area de trabajo

Fuentes de datos
Sistema operacional A

Herramientas de acceso y exploracin

Extraccin

Sistema operacional B

Carga (Load)
A
Data warehouse detallado u objetivo

Sistema operacional N

T, L
Datos Externos Data warehouse agregado o subjetivo Datos Internos no Sistematizados

Anlisis Multidimensional Datamining Tablero de comando Balance scorecard Alertas Reporting Etc.

C
Datamart A Datamart B Datamart N

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

La solucin en profundidad
-Procesamiento -Bases de datos

OLAP vs OLTP

Herramienta de anlisis multidimensional

Data warehouse -Orientados a temas -Integrados -Histricos -No voltiles La metadata

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

El ETL
Problemas a resolver
-F / M -Masculino / Femenino Codificacin de atributos: -0 / 1 -Varn / Mujer Cantidad vendida en: -Kilos Unidad de medida de atributos: -Unidades -Libros Nombres de tablas y atributos: Tabla:PERSONA Tabla:CLIENTE ? Tabla:ENCUESTADO Zona de residencia Fecha de nacimiento

E T L

Acceso a mltiples fuentes de datos

Transformaciones para dejar los datos en el DW modificando: -Formatos -Codificaciones -Niveles de agregacin -Calidad de datos -Otros criterios de integracin Actualizar DW con los datos transformados

Fuentes mltiples para un mismo atributo: Distintos niveles de agregacin

Ventas: producto 01remera manga corta xx Color negro Compras: producto A254-remera manga corta xx.

Diversos niveles de calidad Unificar diversos formatos:

Limpieza de: -Filas -Fuentes Nombre: Jorge Apellido: Lopez Nombre y apellido: Jorge Lopez

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Redundancia
Efectos Base OLTP Data warehouse

Propiedad de la redundancia
Acelerar consultas con datos precalculados Mayor tiempo en actualizacin de datos Mayor probabilidad de generar inconsistencias Mejorar controles

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

El BI: Las categoras


Reportes (Reporting) Reportes (Reporting) Anlisis multidimensional (exploracin OLAP) Anlisis multidimensional (exploracin OLAP) Tableros de Control / /Balance Scorecard Tableros de Control Balance Scorecard Minera de datos (Data Mining) Minera de datos (Data Mining) Alertas y Distribucin Alertas y Distribucin

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Tableros / Balance scorecards

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Tableros / Balance Scorecards

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Reporting

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Anlisis multidimensional - OLAP

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Data Mining

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Distribucin pro activa

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

El recupero de la inversin
ROI, TIR, VAN

Flujo de egresos
-Estimados (Previo) -Reales (Posterior)

Flujo de ingresos
DIFICIL Ingresos duros (reduccin de costos, retencin de clientes, nuevos clientes, etc.) Ingresos blandos (satisfaccin de clientes, empleados con mayor autonoma, etc. )

Depende de la capacidad para tomar buenas decisiones que posean las personas.

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

La nica verdad ?
No incluye impuestos Incluye impuestos Incluye bonificaciones No considera productos no vendidos por canales tradicionales Importe vendido $.7.000.000

Nivel Estratgico Nivel Operativo

Importe vendido $.5.000.000 Importe vendido $.6.000.000

Importe vendido $.8.000.000

DATA WAREHOUSE

Ventas

Marketing

Finanzas

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Etapas del desarrollo de la solucin


Anlisis del negocio
Relevamiento inicial Planificacin del proyecto

Desarrollo del entorno de exploracin


Construir los metadados

Definicin del Alcance

Anlisis y diseo de las decisiones

Construir las Herramientas de usuarios

Formalizacin de las Fuentes de datos

Data warehouse subjetivo

Implantar la infraestructura

Data warehouse objetivo

Procesos de extraccin, transformacin y carga

Implementar la solucin con los usuarios

Desarrollo del data warehouse

Implementacin de la solucin

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

El diseo dimensional conceptual


TIEMPO CLIENTE DISTRIBUCIN GEOGRFICA PRODUCTO

Anio

Categora

Regin

Categora

Trimestre

Cliente

Provincia

Sub categora

Mes

Ciudad

Producto

Da

Local

Monto vendido Cantidad vendida Costo de venta

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

El modelo dimensional lgico- estrella


PRODUCTO id_producto TIEMPO id_fecha Dia Mes Trimestre Ao CLIENTE id_cliente Razon Social Categoria cliente TABLA DE HECHOS id_local id_producto id_fecha id_cliente monto vendido cantidad vendida costo de la venta DISTRIBUCION GEOGRAFICA id_local Nombre local Ciudad Provincia Region Descripcion producto Categoria Subcategoria

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

El modelo dimensional lgico copo de nieve y mixto


PRODUCTO id_producto Descripcion producto Categoria Subcategoria

TIEMPO

Dimensiones des normalizada

id_fecha Dia Mes Trimestre Ao

TABLA DE HECHOS id_producto id_local id_fecha id_cliente monto vendido cantidad vendida costo de la venta

Modelo mixto
Dimensin normalizada
DISTRIBUCION GEOGRAFICA id_local Nombre local id_ciudad

CLIENTE id_cliente Razon Social Categoria cliente

CIUDAD id_ciudad Nombre ciudad id_provincia

PROVINCIA id_provincia Nombre provincia id_region

REGION id_region Nombre region

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Enfoque

Necesidades vs datos existentes

Anlisis de las necesidades de informacin

Alcance

Formalizar datos existentes

Necesidades de informacin

Diseo del data warehouse

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Resumen

1. Los tres problemas del OLTP

2. Qu es Data warehouse y Business Intelligence ? 5. Construccin de la solucin

3. La arquitectura de la solucin.

4. Las herramientas del BI

6. Casos de aplicacin

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Caso prctico

Jurassic Park II

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Arquitectura de la solucin

RRHH

E
Facturacion I

T L

Area de trabajo

Data Warehouse Objetivo

E L

Facturacion II
Data Warehouse Subjetivo

Aplicaciones de Business Intelligence

Boleterias

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Realidad de datos existentes


Sistema de emicin y facturacin de entradas

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Realidad de datos existentes


Sistema de facturacin en locales I

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Realidad de datos existentes


Sistema de facturacin en locales II

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Realidad de datos existentes


Sistema de Recursos Humanos

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Modelo de datos DW Objetivo


PROVINCIA TIPO ESCUELA Id_tipo_escuela Descripcion CIUDAD id_ciudad Nombre ciudad id_provincia Nombre provincia id_region id_provincia REGION id_region Nombre region

ESCUELA Id_escuela Nombre_escuela Id_tipo_escuela VENTA Numero_ticket Fecha_venta Legajo_empleado Id_escuela Id_local

LOCAL Id_local Id_parque Superficie Distancia_boleteria EMPLEADO legajo_empleado Nombre_empleado Apellido_empleado Sueldo Horas_capacitacion Numero_ticket CATEGORIA Id_categoria Descripcion_cateogira PARQUE Id_parque Direccin id_ciudad

ITEM_VENTA Numero_ticket Id_producto Descripcion_producto Precio_unitario Cantidad PRODUCTO Id_producto Descripcion_producto Id_sub_categoria

SUB CATEGORIA Id_sub_categoria Descripcion_sub_categoria Id_categoria

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

El ETL
Periodicidad:
Todos los domingos a las 22 horas.
Este nivel de actualizacin es suficiente para los analistas. Es un momento en que hay disponibilidad de recursos de procesamiento.

Transformaciones y carga: Categoras, subcategoras y productos en los tres sistemas en los que se registran las ventas de productos. Ventas de productos (de los dos sistemas de facturacin) y entradas del otro sistema. Escuelas de los tres sistemas. Empleados de los tres sistemas y del de RRHH. Etc.

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

categoras, subcategorias y productos


Sistema de entradas Sistema de facturacion I Sistema de facturacion II

El ETL

Los productos, categoras y subcategoras de este sistema son exactamente los mismos que los del sistema I

PRODUCTO

SUB CATEGORIA Id_sub_categoria Descripcion_sub_categoria Id_categoria

Data warehouse

CATEGORIA Id_categoria Descripcion_cateogira

Id_producto Descripcion_producto Id_sub_categoria

Se respeta el mismo cdigo pero se adiciona una v delante (tanto en producto como en categora. En la subcategora se repite la categora.. Ventas: Cuando se pasan las filas de la tabla donde se registraron las ventas de entradas, se debe respetar tambin el mismo criterio de codificacin.

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

El diseo dimensional conceptual


EMPLEADO TIEMPO ESCUELA DISTRIBUCIN GEOGRFICA PRODUCTO

Rango capacitacin

Anio

Tipo

Regin

Categora

Provincia Empleado Trimestre Escuela Sub categora

Ciudad Mes Parque Producto

Da Local

Monto vendido Cantidad vendida

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Modelo de datos DW subjetivo


(dimensional lgico mixto)
EMPLEADO Legajo Apellido_nombre Sueldo Horas_capacitacion Rango_horas _capacitacion

TIEMPO id_fecha Dia Mes Trimestre Ao

PRODUCTO id_producto Descripcion producto Categoria Subcategoria

TABLA DE HECHOS id_producto id_local id_fecha id_escuela Legajo monto vendido cantidad vendida

ESCUELA Id_escuela Nombre Id_tipo_escuela TIPO ESCUELA Id_tipo_escuela Tipo_escuela

DISTRIBUCION GEOGRAFICA id_local Nombre local Id_parque

PARQUE Id_parque Direccion id_ciudad

CIUDAD id_ciudad Nombre ciudad id_provincia

PROVINCIA id_provincia Nombre provincia id_region

REGION id_region Nombre region

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Slides adicionales

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Beneficios

Con foco en la Empresa Cambia valor potencial de los datos en valor verdadero. Aumenta la calidad de la toma de decisiones. Permite unificar conceptos de negocios en toda la compaa. Con foco en los Usuarios Maximiza el tiempo de anlisis por sobre la construccin de reportes. Fuente nica y confiable. Autonoma y reduccin de cuellos de botella. Con foco en la Tecnologa de la Informacin Foco en diseo de modelos y administracin. Valor estrtegico de los desarrollos.

Data warehouse y Business Intelligence Sistemas de Datos Curso: Ernesto Chinkes

Usos para el marketing - CRM


Marketing Directo: Ofrecer un producto particular aaun cliente oogrupo de clientes especficos Marketing Directo: Ofrecer un producto particular un cliente grupo de clientes especficos Venta Cruzada --up-selling:Aumentar lalacantidad general que compra un cliente durante Venta Cruzada up-selling:Aumentar cantidad general que compra un cliente durante Anlisis y pronstico de ventas: Anlisis y pronstico de ventas:
un cliente oo grupo de clientes. un cliente grupo de clientes.

la misma compra ooen una posterior.Upselling: persuadir al cliente aacomprar un producto de mayor rentabilidad. la misma compra en una posterior.Upselling: persuadir al cliente comprar un producto de mayor rentabilidad. Evaluar la tendencia de las ventas por distintos Evaluar la tendencia de las ventas por distintos criterios. criterios.

Anlisis de canasta de compra: determinar lalacoleccin de productos que consume Anlisis de canasta de compra: determinar coleccin de productos que consume
publicidad. publicidad.

Anlisis de promociones: Poder medir lalaefectividad de promociones, campaas de Anlisis de promociones: Poder medir efectividad de promociones, campaas de Retencin de clientes y anlisis chrn: analizar aalos clientes que se fueron aalala Retencin de clientes y anlisis chrn: analizar los clientes que se fueron Anlisis de rentabilidad de clientes: Anlisis de rentabilidad de clientes: Centros de atencin al cliente. Centros de atencin al cliente.
asegurar la rentabilidad neta yymotivar aa losclientes aa comprarla. asegurar la rentabilidad neta motivar los clientes comprarla.

competencia (para que vuelva yyno se vayan otros) - -chrn iniciado por el cliente oopor la competencia. competencia (para que vuelva no se vayan otros) chrn iniciado por el cliente por la competencia. Analisis de su valor considerando toda su Analisis de su valor considerando toda su vida. vida.

Empaquetado de productos: detectar una mezcla de productos muy rentables para Empaquetado de productos: detectar una mezcla de productos muy rentables para

Você também pode gostar