Escolar Documentos
Profissional Documentos
Cultura Documentos
08 - DW - Modelagem Dimensional para Datawarehouses
08 - DW - Modelagem Dimensional para Datawarehouses
08 - DW - Modelagem Dimensional para Datawarehouses
Tpicos
Projeto do Warehouse
Modelagem Multidimensional
Ambiente de aplicaes
Utilizao de vrias fontes de informao para se definir estratgias de competitividade nos negcios da empresa
Montanhas de dados Busca e recuperao de informao so difceis Apresentao da informao Tomadas de deciso so prejudicadas
4
Inteligncia do Negcio
Desafio:
Definir regras e tcnicas para a apresentao adequada deste volume de dados visando transform-los em depsitos estruturados de informao, independente da sua origem
Operacional (execuo) x Gerencial (Planejamento e Controle) Objetivos distintos Requisitos de ambientes de BD distintos
Informao Informao
Ambientes de BD Operacionais
Ambientes de BD Gerenciais
... Para fornecer suporte ao processo de tomada de decises na organizao [Inmon, 92]
10
Integrar dados de mltiplas fontes Facilitar o processo de anlise sem impacto para o ambiente de dados operacionais Obter informao de qualidade Atender diferentes tipos de usurios finais Ser flexvel e gil para atender novas anlises
Sistema de Apoio Deciso
DW
Camada Interna: Servidor DW Camada Intermediria: Servidor OLAP Camada Externa: Ferramentas de acesso aos dados
12
DW Metadados
Extrao Limpeza Transformaes Carga Atualizao
BDs operacionais
Fontes externas
13
Etapas:
Planejamento Levantamento de Requisitos e Anlise do Problema Projeto do Data Warehouse Integrao de Dados e Testes Implantao
14
Requisitos
flexibilidade e agilidade para suportar anlises no previstas Permitir anlise das medidas disponibilizadas sob diferentes perspectivas MODELAGEM DIMENSIONAL
Abordagem utilizada:
15
Viso multidimensional
Como foi a distribuio das vendas do Produto X em todas as cidades no ano passado?
16
Viso multidimensional
Facilita o entendimento e visualizao de problemas tpicos de suporte deciso Mais intuitiva para o processamento analtico Utilizada pelas ferramentas OLAP
Viso Relacional
Viso multidimensional
6 3 4
NY
5 5 3
LA
4 5 2
Madison
Coupe Sedan
CITY
Um vetor multidimensional tem um nmero fixo de dimenses e os valores so armazenados nas clulas Cada dimenso consiste de um nmero de elementos
19
DEALERSHIP
VOLUME
6 6 2 3 5 5 2 4 3 2 3 2 7 5 2 4 5 1 6 4 2 1 3 4 2 2 3 20
MINI VAN MINI VAN MINI VAN MINI VAN MINI VAN MINI VAN MINI VAN MINI VAN MINI VAN SPORTS COUPE SPORTS COUPE SPORTS COUPE SPORTS COUPE SPORTS COUPE SPORTS COUPE SPORTS COUPE SPORTS COUPE SPORTS COUPE SEDAN SEDAN SEDAN SEDAN SEDAN SEDAN SEDAN SEDAN SEDAN
NEW YORK NEW YORK NEW YORK LOS ANGELES LOS ANGELES LOS ANGELES MADISON MADISON MADISON NEW YORK NEW YORK NEW YORK LOS ANGELES LOS ANGELES LOS ANGELES MADISON MADISON MADISON NEW YORK NEW YORK NEW YORK LOS ANGELES LOS ANGELES LOS ANGELES MADISON MADISON MADISON
CLYDE GLEASON CARR CLYDE GLEASON CARR CLYDE GLEASON CARR CLYDE GLEASON CARR CLYDE GLEASON CARR CLYDE GLEASON CARR CLYDE GLEASON CARR CLYDE GLEASON CARR CLYDE GLEASON CARR
10
Viso multidimensional
Sedan
6
NY
1
LA
2
Madison
DEALERSHIP
CITY
metfora visual representao intuitiva: dimenses coexistem para todo ponto no cubo e so independentes umas das outras 21
M O D E L
6
NY
1
LA
2
Madison
5
NY
10
LA
1
Madison
6
NY
25
LA
0
Madison
DEALERSHIP
CITY
CITY
CITY
JANUARY
FEBRUARY
MARCH
22
11
Modelagem Multidimensional
Utilizao dos conceitos do modelo multidimensional a fim de representar, de forma clara, eficiente e flexvel, a viso multidimensional dos dados Conceitos
Fatos Dimenses
Hierarquias e Agregaes
23
Fatos
Sales Fact
date_key product_key store_key dollar_sold unit_sold dollar_cost
Volume de vendas (nmero de itens, total em reais), quantidade de itens em estoque, volume de transaes de carto de crdito Valores das medidas (numricas e aditivas) e Referncias para as dimenses (granularidade) No armazena informao redundante! (textos, valores zerados) Quantidade de registros normalmente muito grande em um DW
25
12
Tabela de Fatos
Em um SGBD relacional
Sales Fact
date_key product_key store_key dollar_sold unit_sold dollar_cost
Relao (Tabela) Chaves estrangeiras para as tabelas de dimenso Chave primria subconjunto das chaves estrangeiras Cubo (vetor n-dimensional)
Em um SGBD multidimensional
26
Dimenses
Product Dimension product_key description brand category department package type package size fat content diet type weight weight unit of measure storage type ...
Pontos de vista ou perspectivas do negcio sobre os quais uma organizao deseja guardar registros
Atributos textuais e de domnio discreto preferencialmente Tipo de armazenamento = V ou Tipo de armazenamento = Vcuo ?
27
13
Tabela de Dimenso
Product Dimension product_key description brand category department package type package size fat content diet type weight weight unit of measure storage type ...
Chave simples Fonte principal das clusulas das consultas, agrupamentos e ttulos de relatrios
Brasil SUL NO
Pas Regio Estado Area Dimension area_key state region country ...
29
SE RS
23 45
SC AC AM
62 56 150
23 13
92 87
73 21
23 234
14
..
14
Hierarquias e Agregados
Produto Marca Categoria Produto Tempo Ano Trimestre Ms Geografia Consultas Pas Regio Estado
30
31
15
Esquema Estrela
1 tabela de fatos
n tabelas de dimenses
quem
quando
32
Esquema Estrela
Time Dimension time_key day month year holiday_flag
Sales Fact
time_key product_key store_key dollar_sold unit_sold dollar_cost
33
16
Distingue bem as dimenses dos fatos medidos Simplifica a visualizao dimensional Simetria Eficiente para a realizao de consultas Acomodam mudanas mais facilmente
Exerccio
Suponha o exemplo da concessionria Xcar j apresentado, onde um gerente geral de marketing deseja analisar o volume de vendas dos modelos de carro de cada fornecedor em cada cidade de cada estado dos EUA, onde a concessionria possua filiais. Especifique um esquema estrela para esta concessionria. D alguns exemplos de consultas e anlises que poderiam ser teis para o gerente.
35
17
Exerccio
Concessionria XCar
Mini Van Mini Van
M O D E L
Mini Van
Sedan
Sedan
Sedan
DEALERSHIP
CITY
CITY
CITY
JANUARY
FEBRUARY
MARCH
36
1 tabela de fatos
K tabelas de dimenses
18
40
Sales Fact
time_key product_key store_key dollar_sold unit_sold dollar_cost
19
Maior complexidade
42
Shipping Fact
time_key product_key from_location_key to_location_key shipper_key dollar_cost units_shipped Shipper Dimension shipper_key shipper_name location_key
43
Sales Fact
time_key product_key location_key dollar_sold unit_sold dollar_cost
20
Etapas:
Departamental ou corporativo Pedidos, seguros, inventrio, vendas, entregas Os de maior impacto para o usurio primeiro Nvel mais detalhado das medidas da tabela de fatos Transaes individuais ou posies peridicas Cada item de uma nota fiscal de venda, um carto de embarque em um vo, posio diria de um produto em estoque, posio mensal de uma conta bancria
44
Etapas:
Como descrever os dados do negcio? Data (tempo), produto, cliente, tipo de transao Que medidas devem ser acompanhadas? Granularidade definida pelas dimenses relacionadas Quantidade solicitada, Custo em reais Percentuais no devem ser armazenados, e sim seus numeradores e denominadores
45
21
Envolvimento do patrocinador e usurios gerenciais essencial para o sucesso Adote uma abordagem incremental e iterativa para o desenvolvimento do DW
Apresente os dados de forma simples, e com a semntica clara Nvel de detalhe deve chegar at os dados atmicos Esteja preparado para mudanas no negcio e nos dados D especial ateno aceitao dos usurios
46
Concluso
intuitiva, flexvel e eficiente para consultas Fatos, dimenses e hierarquias Estrela, flocos de neve e constelao de fatos Escolha do: Processo de negcio, granularidade, dimenses e medidas de fatos (nesta ordem)
47
Esquemas
Fases do projeto
22
48
Exerccio
Suponha uma Companhia Area GOAL que deseja construir um DW para o seu negcio. Seu objetivo principal aumentar seu lucro atravs do aumento da taxa de ocupao de seus vos, para isso lanando promoes e descontos aos clientes. Tambm desejvel otimizar a escala da tripulao, e o perodo de manuteno das aeronaves. Projete um esquema para o DW da companhia GOAL, descrevendo o resultado de cada uma das etapas da modelagem dimensional apresentadas. 49
23