Escolar Documentos
Profissional Documentos
Cultura Documentos
Datawarehouse.
Antes de iniciar debemos tener en cuenta los conceptos de una tabla de dimesión y una tabla de
hechos,
Una tabla de dimensiones o entidad de dimensiones es una tabla o entidad de un
esquema de estrella, copo de nieve o constelación que almacena detalles acerca
de hechos. Por ejemplo, una tabla de dimensión de hora almacena los distintos
aspectos del tiempo, como el año, trimestre, mes y día.
Tabla de hechos
En el corazón de un esquema en estrella hay una tabla de hechos, que contiene entradas
de datos que comprenden un conjunto de hechos relacionados con las operaciones
comerciales de una compañía. Cada fila en una tabla de hechos representa una
transacción o evento individual; las columnas documentan los diferentes elementos de
datos que entran en juego al procesar los capturados en la tabla.
Por ejemplo, una tabla de hechos podría contener los datos asociados con el
procesamiento de una transacción de venta en una tienda minorista:
modelo dimensional
de dimensión
contiene métricas o
también llamadas
medidas y es aquello
analizar. Generalmente
evitan la redundancia de
en las tablas de
dimensiones
normalmente tienen
muchos (millones)
registros
compras, movimientos
de contabilidad
tablas
simples desnormalizadas
hechos a través de un
campo clave
los atributos de la tabla
de dimensión ofrecen
información
característica de las
tablas de hechos
de dimensión
relaciones jerárquicas
normalmente tiene
productos, almacenes,
proveedores,
calendario…
Después de haber visto los conceptos de estos dos tipos de tabla, vamos a entender mejor lo que
es el modelo estrella y el modelo copo de nieve que tienen la funcionalidad de relacionar tablas de
dimensión y tablas de hechos.
Modelo Estrella
El modelo estrella es el más sencillo en estructura. Consta de una tabla central de "Hechos" y varias
"dimensiones", incluida una dimensión de "Tiempo". Lo característico de la arquitectura
de estrella es que sólo existe una tabla de dimensiones para cada dimensión.
Normalmente en un modelo relacional, para la dimensión almacen, tendríamos
dos tablas relacionadas entre sí, la primera con la entidad almacen que tendría
una dirección un nombre, un id y una ciudad, la segunda sería la entidad ciudad
que tiene una ubicación (país), un nombre y un departamento en la cual está,
Estas dos entidades se relacionan entre ellas, pero en un modelo dimensional
en este caso el modelo Estrella solo debe haber una tabla de dimensión para
cada entidad, Esto quiere decir que la única tabla que tiene relación con otra es la de
hechos, lo que significa que toda la información relacionada con una dimensión debe
estar en una sola tabla.
El modelo copo de nieve es una variación o derivación del modelo estrella. En este modelo la tabla
de hechos deja de ser la única relacionada con otras tablas ya que existen otras tablas que se
relacionan con las dimensiones y que no tienen relación directa con la tabla de hechos; se puede
decir que es un modelo algo parecido al relacional pero con la diferencia de que tiene una tabla de
hechos que contiene esas dimensiones. El modelo fue concebido para facilitar el mantenimiento de
las dimensiones, sin embargo, esto hace que se vinculen más tablas a las secuencias SQL, haciendo
la extracción de datos más difícil, así como vuelve compleja la tarea de mantener el modelo.
En la tabla se muestra que la dimensión producto tiene diferentes sub-dimensiones que serían la
marca y la categoría del producto.
Ejemplo de modelo copo de nieve.
Imagen tomada de Wikipedia.org
Modelo en estrella:
Este esquema es simple y veloz para ser usado en análisis multidimensionales. Permite
acceder tanto a datos agregados como de detalle.
El diseño de esquemas en estrella permite implementar la funcionalidad de una base de
datos multidimensional utilizando una clásica base de datos relacional.
Es su simple desde el punto de vista del usuario final. Las consultas no son complicadas, ya
que las condiciones y los joins sólo involucran a la tabla de hechos y a las de dimensiones.
Son mas simples de manejar que los modelos de copo de nieve.
Es la opción con mejor rendimiento y velocidad pues permite indexar las dimensiones de
forma individualizada sin que repercuta en el rendimiento de la base de datos en su
conjunto.
Modelo copo de nieve:
El único argumento a favor de los esquemas en copo de nieve es que al estar normalizadas
las tablas de dimensiones, se evita la redundancia de datos y con ello se ahorra espacio.
Se puede usar un esquema de copo de nieve en un Data warehouse, aunque estos sean
realmente grandes y complejos, pero nunca en sistemas donde el tiempo de respuesta sea un
factor crítico para los usuarios.
http://mundodb.es/diseno-data-warehouse-hechos-y-dimensiones-modelo-estrella-vs-
copo-de-nieve
https://searchdatacenter.techtarget.com/es/consejo/Tablas-de-dimension-vs-tablas-de-
hechos-Cual-es-la-diferencia
http://carlospesquera.com/que-son-las-tablas-de-hechos-y-de-dimension/
http://r-pita.blogspot.com/2011/09/modelo-estrella-o-copo-de-nieve.html
https://www.ibm.com/support/knowledgecenter/es/SS9UM9_9.1.2/com.ibm.datatools.di
mensional.ui.doc/topics/c_dm_dim_table.html