Você está na página 1de 18

Page 1

Asterio K. Tanaka
BANCO DE DADOS
DISTRIBUDOS e DATAWAREHOUSING
Asterio K. Tanaka
http://www.uniriotec.br/~tanaka/tin0036
tanaka@uniriotec.br
Modelagem Dimensional Conceitos Bsicos
Asterio K. Tanaka
Modelagem Multidimensional:
Esquema Estrela
Proposto por Ralph Kimball
Dominante no projeto de DW
Caractersticas:
Distingue melhor as dimenses dos fatos medidos
Simplifica a visualizao dimensional
Na verdade uma mistura de modelagem conceitual com
modelagemlgica, pois j bastante voltada para a
abordagemrelacional (a literatura fala sempre em tabelas)
Page 2
Asterio K. Tanaka
Esquema Estrela
Uma tabela de fatos cercada de tabelas de dimenses
Uma tabela de fatos cercada de tabelas de dimenses
Fato
Dimenso
Dimenso
Dimenso
Dimenso
Asterio K. Tanaka
Esquema Estrela - Exemplo
Fato Vendas
pk_tempo
pk_produto
pk_loja
preco_venda
unidades_venda
preco_custo
Dimenso
Tempo
pk_tempo
data
mes
quadrimestre
ano
Flag_feriado
Dimenso Produto
pk_produto
descricao
categoria
marca
Dimenso Loja
pk_loja
nome_loja
endereo
cidade
estado
Page 3
Asterio K. Tanaka
Exemplo Consultas
Vendas por categoria de produto sobre os ltimos seis
meses
Vendas por marca entre 1990 e 1995
pk_tempo pk_produto pk_loja preco_venda unidades_venda preco_custo
Dimenso Loja
Dimenso Produto
Dimenso Tempo
. . .
Medidas Numricas
Colunas da chave composta ligando a tabela
de fatos s tabelas de dimenso
Tabela de Fatos
Tabelas
de
Dimenso
Asterio K. Tanaka
Consulta SQL sobre um esquema estrela
select
[Loja].[NomeLoja], [Tempo].[DataCompleta],
[Produto].[Descricao],
Sum( [Vendas].[Unidades_Venda]) as Total
from
[Vendas], [Tempo], [Produto], [Loja]
where
[Vendas].[CodTempo] = [Tempo].[CodTempo] and
[Vendas].[CodProduto] = [Produto].[CodProduto] and
[Vendas].[CodLoja] = [Loja].[CodLoja]
group by
[Loja].[NomeLoja], [Tempo].[DataCompleta], [Produto].[Descricao]
order by
[Tempo].[DataCompleta], [Loja].[NomeLoja],
[Produto].[Descricao]
QtdVendida
de cada Produto
por Loja e
por Data
Page 4
Asterio K. Tanaka
Resultados
NomeLoja DataCompleta Descricao Total
================================================
East Loja Oct 1, 1994 Athletic Drink 57
East Loja Oct 1, 1994 Beef Stew 128
East Loja Oct 1, 1994 Buffalo Jerky 202
East Loja Oct 1, 1994 Chicken Dinner 161
East Loja Oct 1, 1994 Clear Refresher 73
East Loja Oct 1, 1994 Dried Grits 102
East Loja Oct 1, 1994 Dry Tissues 16
East Loja Oct 1, 1994 Extra Nougat 442
East Loja Oct 1, 1994 Fizzy Classic 46
East Loja Oct 1, 1994 Fizzy Light 65
East Loja Oct 1, 1994 Lasagna 162
East Loja Oct 1, 1994 Lots of Nuts 248
East Loja Oct 1, 1994 Onion Slices 120
Asterio K. Tanaka
Tipos de Dimenses mais
comuns
onde
Fato
quem
quando
o qu
Page 5
Asterio K. Tanaka
Modelagem Dimensional
Esquema Estrela assimtrico
Em relao aos esquemas ERs
Tabela de Fatos
Tabela dominante
usualmente com grande volume de dados
Tabelas de Dimenses
Tabelas que qualificam os fatos
Uma juno liga cada tabela de dimenso tabela
de fatos
volume bem menor que as tabelas de fatos
Asterio K. Tanaka
Comparao entre a Modelagem ER
e a Multidimensional
Planos de consultas genricos
(assimetria do modelo)
Planos de consultas extremanente
distintos e especficos para as
consultas previstas
Dados atmicos e agregados Dados atmicos
Poucas junes Muitas junes para responder a
consultas
Usurios reconhecem o seu
negcio
Usurios acham difcil entender e
navegar pelo modelo
Vrios diagramas dimensionais
(1 para cada processo de negcio)
1 diagrama (vrios processos de
negcio)
Multidimensional
ER
Page 6
Asterio K. Tanaka
Tabela de Fatos
Chave composta pelas chaves das dimenses
Dimenso tempo sempre parte da chave (DW
histrico)
Medida do fato usualmente numrica
Fatos tipicamente aditivos
Mas podem ser
Semi-aditivos
No aditivos
Fato Vendas
pk_tempo
pk_produto
pk_loja
preco_venda
unidades_venda
preco_custo
Asterio K. Tanaka
Fatos Aditivos
So nmericos e podem ser somados
em relao s dimenses existentes
Sempre que, em uma modelagem, um
dado nmerico for apresentado, ento
este ser um bom indcio de um atributo
em fatos.
Em geral, fatos aditivos representam
medidas de atividade do negcio.
Valor Venda, Quantidade de produtos vendidos,..
Page 7
Asterio K. Tanaka
Fatos Semi-Aditivos
Tambm so nmericos
No podem ser somados em relao a
todas as dimenses existentes
semntica no permite.
Em geral, fatos semi-aditivos
representam leituras medidas de
intensidade do negcio.
So snapshots destas leituras que entram no DW.
O valor atual j leva em considerao valores passados.
Nvel de Estoque, Fechamento dirio/mensal de
conta,..
Asterio K. Tanaka
Fatos No-Aditivos
Algumas observaes no nmericas
podem eventualmente ser fatos.
Em um DW para registrar acidentes de
transito:
Atributos:
carro1, carro2, mot.1, mot2., descrio do
acidente, descrio do tempo (chuva,...) e
descrio da pista.
Todas as informaes da situao acima
so fatos!
Page 8
Asterio K. Tanaka
Tabelas de Dimenses
Objetivo:
Servir como cabealho das linhas e colunas das anlises
e filtro nas consultas/relatrios
Caractersticas:
Chaves simples (em geral, artificiais: surrogate keys)
Descrio nica para cada registro
Usualmente no dependente do tempo
Desnormalizada
Hierarquias implcitas
Dimenso Loja
pk_loja
nome_loja
endereo
cidade
estado
Asterio K. Tanaka
Hierarquias de Dimenses
Uma dimenso pode ter mltiplas
hierarquias alm de outros atributos
descritivos
Exemplo para uma empresa atacadista:
Geografia fsica:
cep, cidade, estado, regio, pas
Geografia de vendas:
territrio, regio, zona
Geografia de Distribuio:
AD primria , regio
Page 9
Asterio K. Tanaka
Passos da Modelagem Dimensional
Definio da rea do negcio
Definir processos dentro da rea de negcio
Definio a granularidade desejada para os
dados de cada processo
Considerar volumes e dificuldades de se obter o nvel
desejado
Definio dos atributos e hierarquia das
dimenses
Considerar hierarquias mltiplas
Definio das mtricas das tabelas de Fatos
Observar valores aditivos, semi-aditivos e no aditivos
Asterio K. Tanaka
Dicas importantes na Modelagem Dimensional
Faa ou use um modelo de dados convencional E-R como ponto
de partida para o trabalho de modelagem dimensional.
Observe os relacionamentos 1:N existentes. Eles podem sugerir
dimenses
Observe as entidades fortes. Elas tambm podem sugerir
dimenses.
Observe as entidades que expressam documentos como Nota
Fiscal, Pedido, Ordem de Compra, etc. Elas podem sugerir fatos.
Observe os relacionamentos M:N. Na sua interseo, pode haver
valores numricos. Isto sugere fatos.
Observe os atributos que estaro nas tabelas de dimenses.
Analise a relao de hierarquias entre esses atributos de
dimenso. Atente para os relacionamentos M:N entre eles. Isto
pode definir granularidade.
Page 10
Asterio K. Tanaka
Dicas importantes na Modelagem Dimensional
As tabelas FATOS, tipicamente, armazenam dados, valores
atmicos ou agregados obtidos a partir destes.
As mtricas das tabelas FATOS so normalmente aditivas em
certas dimenses.
As tabelas FATOS possuem chaves que as conectam s
diferentes DIMENSES que as circundam. Essa conexo se d
num nvel de granularidade compatvel entre elas (FATO e
DIMENSO).
As tabelas DIMENSO armazenam os valores de filtro, check,
acesso e textos que caracterizam os dados trabalhados.
As tabelas FATOS so normalmente normalizadas.
As tabelas DIMENSES so normalmente desnormalizadas
(Esquema Estrela).
A granularidade combinada da tabela FATO com a de suas
tabelas DIMENSES determina o nmero de linhas das tabelas
do projeto.
Asterio K. Tanaka
Exemplo
Processos de uma empresa revendedora
de produtos:
planos de estoque, ordens de compra, inventrio,
pedidos de clientes, expedio de pedidos, crditos, etc.
Processos identificados
cria-se uma ou mais tabelas de fatos a partir de cada um
deles.
Neste ponto necessrio decidir o fato
individual naquela tabela
granularidade da tabela
uma linha sobre um produto, um perfil de venda
dirio do produto, ou um perfil de venda mensal do
produto
Por exemplo: tabela de fatos vendas acumuladas do
produto.
Page 11
Asterio K. Tanaka
Exemplo
Definir dimenses e suas respectivas
granularidades.
dimenses tempo, produto e vendedor so criadas.
outras dimenses descritivas como:
local-de-expedio, local-de-recebimento, modo-de-
envio.
Cada dimenso pode ser vista como um
ponto de entrada para a tabela de fatos.
A escolha das dimenses o ponto chave no
projeto.
O passo seguinte consiste em detalhar:
todas as medidas que constaro da tabela de fatos; e
completar as tabelas de dimenses.
Asterio K. Tanaka
Exemplo
Page 12
Asterio K. Tanaka
Variaes do Esquema Estrela
Esquema floco de neve
O esquema floco de neve uma variao do
esquema estrela no qual todas as tabelas
dimenso so normalizadas na terceira forma
normal (3FN)
Reduzem a redundncia mas aumentam a
complexidade do esquema e consequentemente
a compreenso por parte dos usurios
Dificultam as implementaes de ferramentas
de visualizao dos dados
Asterio K. Tanaka
Esquema Floco de Neve
Dimenses normalizadas
Fatos como no
Esquema estrela
Page 13
Asterio K. Tanaka
Esquema Flocos de Neve -
Exemplo
pk_tempo
data
ms
Tempo
pk_produto
pk_tempo
pk_loja
Unidades_vendidas
Preco_venda
Preco_custo
Medidas
pk_produto
descProd
Categoria
Produto
Ms
Ano
Ms
Ano
Ano
Cidade
Estado
Cidade
Pas
Regio
Pas
Estado
Pas
Estado
Pk_loja
Cidade
Loja

Tabela de Fatos
De Vendas
Asterio K. Tanaka
Esquema Constelao de Fatos
Mltiplas tabela de fatos com dimenses
compartilhadas
Maior complexidade
Integra diferentes processos
Page 14
Asterio K. Tanaka
Esquema Constelao de Fatos
Sales Fact
time_key
product_key
location_key
dollar_sold
unit_sold
dollar_cost
Time Dimension
time_key
day_of_week
month
quarter
year
holiday_flag
Product Dimension
product_key
description
brand
category
Location Dimension
loc_key
loc_name
address
city
state
Shipping Fact
time_key
product_key
from_location_key
to_location_key
shipper_key
dollar_cost
units_shipped
Shipper Dimension
shipper_key
shipper_name
location_key
Asterio K. Tanaka
Modelo Entidades-Relacionamentos
(adequado para BDs operacionais)
Page 15
Asterio K. Tanaka
Modelo Dimensional
(Estrela ou Constelao de Fatos)
Fatos
Dimenses
Dimenses
desnormalizadas
Asterio K. Tanaka
Tabelas de Dimenso
Segundo KIMBALL, as tabelas de
dimenso no devem ser
normalizadas pois:
1) no h atualizao freqente nas bases;
2) o espao em disco economizado
relativamente pequeno e;
3) esse ganho de espao no justifica a perda de
performance na realizao de consultas por
conta dos joins necessrios em caso de
normalizao.
Page 16
Asterio K. Tanaka
Esquema Estrela - Conceitual
Asterio K. Tanaka
Esquema Estrela - Lgico
Page 17
Asterio K. Tanaka
Implementao do Modelo
Dimensional
SGBDs multidimensionais
implementam fisicamente o modelo
dimensional
problemas de desempenho, segurana e
confiabilidade
Esparsidade: clulas onde no h dados
SGBDs relacionais
Maior aceitao
Exige mapeamento (vide artigo de Colonese et
al.)
Asterio K. Tanaka
Escolha do SGBD
Page 18
Asterio K. Tanaka
Esquema Estrela - Fsico (Dimensional)

Você também pode gostar