Você está na página 1de 8

Mini caso para la asignación en el módulo 3

La asignación en el módulo 3 le da la oportunidad de aplicar la mayoría de los conceptos

del módulo 3 y algunos de los conceptos del módulo 2. Puesto que la asignación se basa

estrechamente en los problemas de práctica en el módulo 3, debe intentar el miniestudio de caso

para los problemas de práctica y, a continuación, revisar los detalles de la solución.

Este miniestudio de caso contiene dos fuentes de datos con datos de muestra junto con

una declaración de necesidades de negocio. Con las fuentes de datos y las necesidades de

negocio, especificará un modelo dimensional con dimensiones, medidas y granulado, creará un

diseño de esquema para el data-warehouse que integre las fuentes de datos, identificará los

problemas de integración en el diseño y rellenará las tablas del data-warehouse de filas de

ejemplo en las fuentes de datos.

Fuentes de datos
Fitness Unlimited es un proveedor líder de centros de ejercicios con una variedad de

programas de acondicionamiento físico y opciones de membresía. Fitness Unlimited mantiene

una base de datos minorista para rastrear las ventas de servicios y mercancías. En el ERD para la

base de datos minorista (Figura 1), una venta contiene un título (Venta) con fecha de venta y una

colección de mercancía registrada en la relación M-N Contains. Las compras de servicio se

registran en el tipo de entidad ServPurchase con relaciones de 1-M de ServiceCategory y

Member. Los servicios típicos son lecciones, uso de equipos Premium y eventos sociales. La

relación MemTypeOf es opcional para los miembros porque los miembros invitados pueden usar

un centro de fitness y comprar productos y servicios a corto plazo sin tener una membresía

pagada. Se muestran las tablas con filas de muestra después de la figura 1.


4/19/2019 Asignación del módulo 3 Página 2

Franchise MemberType
FranchId MemTypeId
FranchRegion MemTypeName
FranchPostalCode MemTypePrice
FranchModelType

MemTypeOf

Member
FranchiseOf MmbrId Sale
MmbrName
ServiceCategory SoldTo SaleId
MmbrZip
SaleDate
ServCatId MmbrEmail
ServCatName MmbrDate
ServCatPrice
Qty
Contains

ServPurchase ServMember
ServPurchId
Merchandise
ServCatOf
ServPurchDate MerchId
MerchName
MerchPrice
MerchType

Figura 1: ERD para la base de datos Retail Fitness

Franchise
FranchId FranchRegion FranchPostalCode FranchModelType
F1 Noroeste 98011 Completo
F2 Montaña 80111 Medio
F3 Central 45236 Limitada

MemberType
MemTypeId MemTypeName MemTypePrice
M1 Platino $1.000
M2 Oro $800
M3 Valor $300

ServiceCategory
ServCatId ServCatName ServCatPrice
SC1 Máquina de bolas $15
SC2 Lección privada $75
SC3 Clase adulta $150
SC4 Clase secundaria $125
4/19/2019 Asignación del módulo 3 Página 3

Merchandise
MerchId MerchName MerchPrice MerchType
MC1 Las pelotas Wilson $3 Bolas
MC2 La raqueta Wilson $200 Raqueta
MC3 Zapatillas Adidas $100 Zapatos
MC4 La raqueta $40 Raqueta

Member
MmbrId MmbrName MmbrZip MemTypeId MmbrDate FranchId MmbrEmail
1111 Joe 98011 M1 1-Feb-2009 F1 joe@serv1.com
2222 María 80112 M2 1-Jan-2010 F2 mary@serv2.com
3333 Sue 45327 M3 3-Mar-2011 F3 sue@serv3.com
4444 Jorge 45236 F3 george@serv4.com

Sale
SaleId SaleDate MmbrId
1111 10-Feb-2013 1111
2222 13-Feb-2013 2222
3333 13-Feb-2013 2222
4444 14-Feb-2013 3333

Contains
MerchId SaleId Qty
MC1 1111 2
MC2 1111 1
MC4 2222 1
MC3 3333 1
MC4 4444 1

ServicePurchase
ServPurchId ServPurchDate MmbrId PassCatId
1111 13-Feb-2013 1111 SC1
2222 14-Feb-2013 2222 SC2
4444 15-Feb-2013 4444 SC3

Las franquicias también venden eventos especiales a empresas y otras organizaciones.

Dado que las promociones y las ventas de eventos especiales no son estándar entre las

franquicias, las hojas de cálculo se suelen utilizar para realizar un seguimiento de eventos

especiales. La base de datos de ventas de franquicias nunca se amplió para acomodar las ventas

de eventos especiales. La hoja de trabajo de eventos especiales muestra un formato típico para el

seguimiento de ventas de eventos especiales por una franquicia. La mayoría de las franquicias

utilizan una hoja de cálculo similar.


4/19/2019 Asignación del módulo 3 Página 4

Special Events Worksheet


Corporate Corporate Customer Name Event Type Event Date Amount
Customer And Location Code
Id
CC1 First Data, Greenwood Village L-A Adult Social 13-Feb-2013 $1.000
CC2 DU Tennis, Denver L-B Pioneer social 14-Feb-2013 $500
CC3 Creek High School, L-C Team Practice 21-Feb-2013 $200
Greenwood
Village

Estimaciones de tamaño de fuente de datos


Para calcular el tamaño de grano, debe usar estas estimaciones sobre las cardinalidades de

las tablas y los valores únicos de algunas columnas.

 Filas de Franquicia: 350

 Códigos postales de Franquicia: 200

 Filas de MemberType: 10

 Filas de Mercancía: 500

 Valores de MerchType: 30

 Filas de ServCategoría: 20

 Filas de Miembros: 50,000

 Códigos postales de Miembros: 500

 Filas de Venta: 150,000 por año

 Filas de Contiene: 450,000 por año

 Filas de ServicePurchase: 100,000 filas por año

 Filas de SpecialEvents de la hoja de trabajo: 300 por año por franquicia con 200

Franquicias usando esta hoja de cálculo

 150 clientes únicos por hoja de evento especial


4/19/2019 Asignación del módulo 3 Página 5

Necesidades de negocio
El data-warehouse debe admitir el análisis de las ventas de mercancías y las compras de

servicios por franquicia, mercancía o tipo de servicio, y cliente a lo largo del tiempo. Para la

mercancía, el importe de ventas se calcula como la cantidad de veces el precio de venta. Para las

compras de servicios, cada venta de unidades se registra por separado, por lo que solo el precio

de servicio en el momento de la compra se registra. Para el cliente, las ventas de mercancías

deben ser rastreadas por código postal, fecha de membresía y tipo de miembro. Para la

franquicia, las ventas de mercancías deben ser rastreadas por región de franquicia, código postal

y tipo de modelo.

La oficina de ventas corporativas quiere un alto nivel de flexibilidad para el análisis de

ventas. Para el análisis de minería de datos, necesitan detalles por cliente individual, producto o

servicio, y franquicia y fecha. Para las aplicaciones de informes típicas, necesitan detalles por

ubicación del cliente, ubicación de la franquicia, y el tipo de producto o servicio, y la semana.

Problemas
Debe diseñar un esquema de estrella (o variación) para admitir el análisis de ingresos.

Debe prestar mucha atención al grano de la tabla de hechos, la parte principal del diagrama de

esquema de estrella. Como parte del diseño, debe identificar todas las dimensiones relevantes

con jerarquías especificadas. En la documentación, debe identificar los problemas de integración

en el esquema de estrella e indicar la asignación de fuentes de datos en tablas.

Debe rellenar las tablas del data-warehouse en función de los datos de las tablas

operativas y la hoja de cálculo. No es necesario insertar los datos en las tablas. Solo puede

mostrar listados de tablas en el documento de solución. Las filas de muestra deben incluir todos

los eventos de ingresos del intervalo del 10 de febrero de 2013 al 21 de febrero de 2013.
4/19/2019 Asignación del módulo 3 Página 6

1. Debe identificar las dimensiones, asignar dimensiones a fuentes de datos y especificar las

jerarquías de dimensiones. Para cada dimensión, debe identificar sus fuentes de datos y los

atributos en cada fuente de datos. Para las dimensiones jerárquicas, debe indicar los niveles

de amplio a estrecho.

2. Debe especificar medidas, fuentes de datos relacionados y medir las propiedades de

agregación.

3. Identifique el grano en su diseño dimensional utilizando las necesidades del negocio como

guía. A continuación, debe indicar los requisitos de almacenamiento relativos para el grano

utilizando las estadísticas de las fuentes de datos. Con las estimaciones de cardinalidad

proporcionadas, debe determinar el tamaño de la tabla de hechos o la dispersión y, a

continuación, calcular la variable de tamaño de grano desconocida. Por ejemplo, debe

calcular la dispersión si se da el tamaño de la tabla de hechos.

4. Amplíe el análisis para diseñar un esquema de estrella (o variación) para admitir el análisis

de inventario. Para cada tabla, debe definir el nombre de la tabla, la clave principal y las

columnas. No es necesario escribir instrucciones CREATE TABLE completas.

5. Identifique los posibles problemas de integración en su esquema de estrella e indique las

resoluciones preferidas de los problemas de integración. Para las relaciones de dimensión-

hechos incompletas, también debe indicar si las columnas de una tabla de dimensiones

permiten valores nulos.

6. Debe rellenar las tablas del data-warehouse en función de los datos de las tablas de ejemplo y

de la hoja de cálculo. No es necesario escribir instrucciones INSERT de SQL ni insertar los

datos en las tablas de la base de datos. Solo puede mostrar los listados de las tablas en su

solución. Debe indicar asignaciones de fuentes de datos en tablas. Por ejemplo, una
4/19/2019 Asignación del módulo 3 Página 7

asignación puede implicar la generación de nuevos valores de clave principal para una tabla

del data-warehouse o el uso de un valor predeterminado para un valor que falta.

Calidad de la solución
La calidad es bastante subjetiva en los diseños de data-warehouse, pero algunos
elementos son menos subjetivos. Sugiero que aborde estos elementos de calidad en la parte
adecuada de la solución.

 Patrón de esquema: debe usar un patrón de esquema reconocido: esquema de estrella,


constelación o copo de nieve.

 Selección de la tabla de hechos: usted debe estudiar la selección de la tabla de hechos en la


solución para el mini caso de la práctica para la inspirarse. Normalmente, la tabla de hechos
combina una solución de dos niveles en un esquema de origen en una única tabla de hechos.
Por ejemplo, un encabezado de pedido y el detalle del pedido normalmente se combinan en
una tabla de hechos que registra los detalles del pedido con relaciones de dimensión para
capturar el encabezado del pedido.

 Faltan datos en las tablas rellenadas: debe asegurarse de que las tablas rellenadas incluyan
todos los eventos de ingresos mostrados en ambas fuentes de datos. La mejor comprobación
del diseño del esquema consiste en asignar filas de ejemplo de las fuentes de datos a los data-
warehouses.

 Simplicidad: normalmente, un diseño de esquema del data-warehouse simplifica los


esquemas de las fuentes de datos subyacentes. La simplificación puede implicar la
combinación de algunos elementos de fuentes de datos en las decisiones sobre dimensiones y
tablas de hechos.

Clasificación
El método de evaluación para esta asignación es la revisión por pares. Cada problema tiene
un grado igual.

Sumisión
Debe enviar 6 documentos a la revisión por pares para la asignación del módulo 3. Cada
documento contiene una solución completa para el problema. Usted debe formatear
4/19/2019 Asignación del módulo 3 Página 8

cuidadosamente sus documentos para que pueda ser fácilmente calificado. Por favor, escriba el
número del problema en la parte superior de la página.

Você também pode gostar