Escolar Documentos
Profissional Documentos
Cultura Documentos
10 BDDDW Mod Dimens Basicol
10 BDDDW Mod Dimens Basicol
DISTRIBUDOS e DATAWAREHOUSING
Asterio K. Tanaka
http://www.uniriotec.br/~tanaka/tin0036
tanaka@uniriotec.br
Modelagem Multidimensional:
Esquema Estrela
Proposto por Ralph Kimball
Dominante no projeto de DW
Caractersticas:
Distingue melhor as dimenses dos fatos medidos
Simplifica a visualizao dimensional
Na verdade uma mistura de modelagem conceitual com
modelagem lgica, pois j bastante voltada para a
abordagem relacional (a literatura fala sempre em tabelas)
Asterio K. Tanaka
Page 1
Esquema Estrela
Uma
Umatabela
tabelade
defatos
fatoscercada
cercadade
detabelas
tabelasde
dedimenses
dimenses
Dimenso
Dimenso
Fato
Dimenso
Dimenso
Asterio K. Tanaka
Dimenso
Tempo
pk_tempo
data
mes
quadrimestre
ano
Flag_feriado
Fato Vendas
pk_tempo
pk_produto
pk_loja
preco_venda
unidades_venda
preco_custo
pk_produto
descricao
categoria
marca
Dimenso Loja
pk_loja
nome_loja
endereo
cidade
estado
Asterio K. Tanaka
Page 2
Exemplo Consultas
Vendas por categoria de produto sobre os ltimos seis
meses
Vendas por marca entre 1990 e 1995
Dimenso Loja
pk_tempo
pk_produto
pk_loja
Medidas Numricas
preco_venda unidades_venda
preco_custo
Dimenso Produto
Tabelas
de
Dimenso
Dimenso Tempo
Tabela de Fatos
...
Asterio K. Tanaka
Asterio K. Tanaka
Page 3
Resultados
NomeLoja
DataCompleta Descricao
Total
================================================
East Loja
Oct 1, 1994
Athletic Drink 57
East Loja
Oct 1, 1994
Beef Stew
128
East Loja
Oct 1, 1994
Buffalo Jerky 202
East Loja
Oct 1, 1994
Chicken Dinner 161
East Loja
Oct 1, 1994
Clear Refresher 73
East Loja
Oct 1, 1994
Dried Grits
102
East Loja
Oct 1, 1994
Dry Tissues
16
East Loja
Oct 1, 1994
Extra Nougat 442
East Loja
Oct 1, 1994
Fizzy Classic 46
East Loja
Oct 1, 1994
Fizzy Light
65
East Loja
Oct 1, 1994
Lasagna
162
East Loja
Oct 1, 1994
Lots of Nuts
248
East Loja
Oct 1, 1994
Onion Slices
120
Asterio K. Tanaka
quando
onde
Fato
quem
o qu
Asterio K. Tanaka
Page 4
Modelagem Dimensional
Tabela de Fatos
Tabela dominante
usualmente com grande volume de dados
Tabelas de Dimenses
Tabelas que qualificam os fatos
Uma juno liga cada tabela de dimenso tabela
de fatos
volume bem menor que as tabelas de fatos
Asterio K. Tanaka
ER
1 diagrama (vrios processos de
negcio)
Poucas junes
Dados atmicos
Asterio K. Tanaka
Page 5
Tabela de Fatos
pk_loja
preco_venda
unidades_venda
preco_custo
Semi-aditivos
No aditivos
Asterio K. Tanaka
Fatos Aditivos
So nmericos e podem ser somados
em relao s dimenses existentes
Sempre que, em uma modelagem, um
dado nmerico for apresentado, ento
este ser um bom indcio de um atributo
em fatos.
Em geral, fatos aditivos representam
medidas de atividade do negcio.
Valor Venda, Quantidade de produtos vendidos,..
Asterio K. Tanaka
Page 6
Fatos Semi-Aditivos
Tambm so nmericos
No podem ser somados em relao a
todas as dimenses existentes
semntica no permite.
Fatos No-Aditivos
Algumas observaes no nmericas
podem eventualmente ser fatos.
Em um DW para registrar acidentes de
transito:
Atributos:
carro1, carro2, mot.1, mot2., descrio do
acidente, descrio do tempo (chuva,...) e
descrio da pista.
Page 7
Tabelas de Dimenses
Objetivo:
Caractersticas:
Asterio K. Tanaka
Hierarquias de Dimenses
Geografia fsica:
cep, cidade, estado, regio, pas
Geografia de vendas:
territrio, regio, zona
Geografia de Distribuio:
AD primria , regio
Asterio K. Tanaka
Page 8
Asterio K. Tanaka
Asterio K. Tanaka
Page 9
Exemplo
Processos de uma empresa revendedora
de produtos:
planos de estoque, ordens de compra, inventrio,
pedidos de clientes, expedio de pedidos, crditos, etc.
Processos identificados
cria-se uma ou mais tabelas de fatos a partir de cada um
deles.
Page 10
Exemplo
Definir dimenses e suas respectivas
granularidades.
dimenses tempo, produto e vendedor so criadas.
outras dimenses descritivas como:
local-de-expedio, local-de-recebimento, modo-deenvio.
Asterio K. Tanaka
Exemplo
Asterio K. Tanaka
Page 11
Fatos como no
Esquema estrela
Asterio K. Tanaka
Page 12
Ano
Ms
Ano
Tabela de Fatos
De Vendas
Tempo
pk_tempo
data
ms
pk_tempo
Cidade
Estado
pk_loja
Pk_loja
Cidade
Unidades_vendidas
Preco_venda
Estado
Pas
Pas
pk_produto
descProd
Categoria
pk_produto
Loja
Cidade
Estado
Produto
Preco_custo
Pas
Regio
Medidas
Asterio K. Tanaka
Asterio K. Tanaka
Page 13
Shipping Fact
Product Dimension
Sales Fact
time_key
product_key
location_key
dollar_sold
unit_sold
dollar_cost
product_key
description
brand
category
Location Dimension
loc_key
loc_name
address
city
state
time_key
product_key
from_location_key
to_location_key
shipper_key
dollar_cost
units_shipped
Shipper Dimension
shipper_key
shipper_name
location_key
Asterio K. Tanaka
Modelo Entidades-Relacionamentos
(adequado para BDs operacionais)
Asterio K. Tanaka
Page 14
Modelo Dimensional
(Estrela ou Constelao de Fatos)
Dimenses
Fatos
Dimenses
desnormalizadas
Asterio K. Tanaka
Tabelas de Dimenso
Segundo KIMBALL, as tabelas de
dimenso no devem ser
normalizadas pois:
1) no h atualizao freqente nas bases;
2) o espao em disco economizado
relativamente pequeno e;
3) esse ganho de espao no justifica a perda de
performance na realizao de consultas por
conta dos joins necessrios em caso de
normalizao.
Asterio K. Tanaka
Page 15
Asterio K. Tanaka
Asterio K. Tanaka
Page 16
Implementao do Modelo
Dimensional
SGBDs multidimensionais
implementam fisicamente o modelo
dimensional
problemas de desempenho, segurana e
confiabilidade
Esparsidade: clulas onde no h dados
SGBDs relacionais
Maior aceitao
Exige mapeamento (vide artigo de Colonese et
al.)
Asterio K. Tanaka
Escolha do SGBD
Asterio K. Tanaka
Page 17
Asterio K. Tanaka
Page 18