Escolar Documentos
Profissional Documentos
Cultura Documentos
INTEGRANTES:
INSTRUCTOR:
ESPECIALIZACIÓN TECNOLÓGICA
Modalidad Presencial
Servicio Nacional de Aprendizaje SENA
2017
DATA MART
(Mercado de Datos)
DEFINICIÓN
Los Data Marts son subconjuntos de datos con el propósito de ayudar a que un
área específica dentro del negocio pueda tomar mejores decisiones. Los datos
existentes en este contexto pueden ser agrupados, explorados y propagados de
múltiples formas para que diversos grupos de usuarios realicen la explotación de
los mismos de la forma más conveniente según sus necesidades.
Históricamente, los datos de una empresa suelen residir en bases que se diseñaron
principalmente para introducir y almacenar datos, mediante el llamado Proceso de
Transacciones Online (OLTP). Este método es idóneo para insertar, modificar o
borrar registros, pero no lo es tanto para responder a complejas consultas.
La relación entre los datos responde, cuando existe, a unas técnicas llamadas de
Entidad-Relación (modelo-Relacional).
Se basan en los populares cubos OLAP, que se construyen agregando, según los
requisitos de cada área o departamento, las dimensiones y los indicadores
necesarios de cada cubo relacional.
Los Data Marts que están dotados con estas estructuras óptimas de análisis
presentan las siguientes ventajas:
Los data mart dependientes son aquellos que reciben los datos desde una data
warehouse. En este tipo de Data mart la fuente de los datos es única.
Son aquellos que toman sus datos directamente desde los sistemas transaccionales
y no dependen de otros data warehouse. Este tipo de Datamart se alimenta
generalmente de las organizaciones.
Los data mart híbridos permiten combinar las fuentes de datos de un data
warehouse corporativo con otras fuentes de datos tales como sistemas
transaccionales y/o operacionales.
Dado que un data mart soporta menos usuarios que un data warehouse se puede
optimizar para recuperar más rápidamente los datos que necesitan los usuarios.
Tomado: http://www.evaluandosoftware.com/abc-del-data-mart/
Dar a los usuarios acceso a los datos que ellos necesitan para analizarlos
más a menudo
Proveer los datos en una forma que concuerda la vista colectiva de los datos
por un grupo de usuarios en un departamento o función de negocio
Mejorar el tiempo de respuesta al usuario final debido a la reducción en el
volumen de información a ser accedido.
Proveer datos apropiadamente estructurados para satisfacer los
requerimientos de las herramientas de acceso de usuario final.
Un número de herramientas de acceso de usuario, particularmente
especialistas en minería de datos o herramientas de análisis
multidimensional pueden requerir sus propias estructuras internas de bases
de datos.
En la práctica, estas herramientas a menudo crean su propio data mart
diseñado para soportar su funcionalidad específica.
Los Data Marts normalmente usan menos datos de tal manera que la tarea
de carga de datos es más fácil, y de esta manera la implementación de un
data mart es más simple comparado con un datawarehouse corporativo.
El costo de implementación de un data mart normalmente es menor que el
requerido para establecer un datawarehouse.
Los potenciales usuarios de un data mart son más claramente definidos y
puede ser más fácilmente involucrados para obtener soporte para un
proyecto de Data Mart.
Aspectos del Data Mart
Los usuarios esperan tiempos de respuesta más rápidos desde data marts
que desde data warehouses, sin embargo, el deterioro del rendimiento de un
data mart crece con el tamaño.
Varios vendedores de data marts están investigando maneras para reducir el
tamaño de data marts para ganar mejoras en el rendimiento; por ejemplo
soportar dimensiones y jerarquías dinámicas para reducir el tamaño de la
base de datos y tiempo de consolidación.
Dimensiones dinámicas permiten agregaciones a ser calculadas sobre
demanda antes que pre calculados y almacenados en los cubos de bases de
datos multidimensionales (MDDB).
Rendimiento de carga del Data Mart
Es conveniente que una aplicación de data warehouse o data mart sea desarrollada
considerando que va a ser explotada en una arquitectura de tres capas
(aplicaciones distribuidas); las cuales son:
Construcción Incremental:
Resultados de Implementación:
Tomado:https://www.adictosaltrabajo.com/tutoriales/datawarehouse4/#2.10.2.Razones%20para%20crear%20
un%20Data%20Mart%7Coutline
EJEMPLO
Ilustraremos los conceptos que aprendimos en esta unidad con nuestro ejemplo de La
Distribuidora Latinoamericana de Alimentos (DLA).
Construiremos el modelo del data mart de ventas en tres etapas:
Dimensiones
Ventas_Importe X X X X X
Ventas_Costo X X X X X
Ventas_Unidades X X X X X
Ventas_ImporteTotal X X X X X
Ventas_Ganancia X X X X X
Ventas_Promedio X X X X X
Si trabajamos en forma correcta, debería haber una exacta coincidencia entre la definición de las
dimensiones y los datos que estamos extrayendo de las fuentes transaccionales. Si esa
coincidencia no ocurre, en alguna de las dos etapas tenemos un error, o bien los datos de origen
no están correctos o bien definimos mal las dimensiones.
Comenzaremos por la Dimensión Tiempo ya que, como aprendimos en esta unidad, es la más
importante dentro de cualquier data mart.
Nuestro cliente necesita analizar sus datos diariamente, entonces definiremos los niveles:
Año
Semestre
Trimestre
Mes
Día
Dimensión Tiempo
* Año
** Semestre
*** Trimestre
**** Mes
Dimensión Sucursal, usaremos un esquema estrella y su estructura jerárquica será:
Dimensión Sucursal
* Sucursal
** Tipo Sucursal
*** País
**** Provincia
Dimensión Vendedor, al igual que sucursal, tendrá un esquema estrella y quedará definida por los
niveles:
Dimensión Vendedor
* Sucursal
** Sección
*** Vendedor
Dimensión Cliente
* País
** Provincia
*** Ciudad
Dimensión Producto, esta dimensión la construiremos según un esquema copo de nieve. En estos
casos se mantiene la normalización propia de los sistemas OLTP. Cada tabla contiene los datos
iniciales y su relación con el resto.
La dimensión nos quedará normalizada por lo que usaremos más tablas para construirla.
Nuestro cliente puede clasificar sus productos según la categoría, el departamento y la familia de
producto a la que pertenece.
Fact_Ventas
ID_Fecha
ID_Producto
ID_Cliente
ID_Vendedor
Fact_Ventas
ID_Fecha
ID_Producto
ID_Cliente
ID_Vendedor
Ventas_Importe
Realizadas estas tres etapas, podemos ver el diseño completo de nuestro data mart.
Lecciones Aprendidas
Un Data Mart adopta un esquema estrella para maximizar la
performance de las consultas.
Las dimensiones son categorías descriptivas por las cuales
las medidas se pueden separar para el análisis.
La dimensión Tiempo está implícita en todo Data Mart
Las medidas son los datos numéricos de interés primario
para el cliente
Con las medidas calculadas se pueden construir alertas