Escolar Documentos
Profissional Documentos
Cultura Documentos
Overview
Prof. Jorge Surian (jsurian@uol.com.br)
Agenda
Conceito Geral de Modelagem Dimensional
Conceitos Bsicos da Modelagem Dimensional e OLAP Exemplo Introdutrio Exemplo Conceitual
A abordagem dimensional resulta em um projeto de banco de dados voltado a otimizao da performance nos caminhos previstos para o acesso aos dados pelos usurios. Assim vrios clculos intermedirios so armazenados, criando teis redundncias que tornam possvel evitar-se clculos repetitivos.
J no exemplo acima fcil observar que a separao no feita por modelos tcnicos e sim a partir do negcio em si. Essa ser a abordagem que nortear nossos estudos.
5
possvel fazermos uma anlise considerando apenas trs dimenses: Produto, Loja e Tempo. Essas dimenses podem ser representadas num modelo tridimensional, como o apresentado a seguir:
Exemplo Introdutrio
Caf Fiap PodCast Mergulhe nos Dados! Origem: Dados de um ERP convencional, mas somente de dados relativos as vendas de produtos nas lojas num determinado perodo (tempo). Armazm de Dados = Nossa Sala (!) Parede 1: Produtos Parede 2: Lojas (Dimenso Geogrfica) Altura: Tempo
10
11
Modelo Bsico
Resumidamente, chegaramos a:
12
Pontos Relevantes...
A dimenso Produto se origina da tabela de Produtos do ERP. Observar que no se trata de uma cpia dessa tabela, mas apenas da origem dela. Notar que algumas tabelas que no modelo transacional so ligadas a tabela de produtos (como Linha) simplesmente desapareceram! Isso ocorre porque estamos interessados to somente na gesto das informaes, mas no no seu tratamento relacional. Com certeza a tabela de Produtos do esquema transacional trar inmeros outros atributos que no sero importados mesmo para o mais completo dos modelos dimensionais!
13
Pontos Relevantes...
A dimenso Loja no se origina de nenhuma tabela dos sistemas locais, mas de uma tabela central do ERP! bastante esperada esse tipo de situao, pois faz pouco sentido se construir um Data Warehouse que venha a gerenciar um baixo volume de dados. Se o problema gerencial for simples, raramente um DW ser a soluo...
14
Pontos Relevantes...
A dimenso Tempo no uma tabela que exista no modelo relacional, pois montada a partir da necessidade do tomador de decises. Embora no seja obrigatria por definio, rarssimas sero as solues em que essa dimenso no aparea. Quanto mais complexo o problema que se deseja analisar, maior o nmero de atributos da dimenso tempo, que poder chegar a uma centena em alguns casos.
15
Pontos Relevantes...
O fato ProdutosComercializados habitualmente se origina das tabelas de movimentao dos sistemas transacionais. Observar que tambm muito comum que se originem de entidades fracas, como seriam os itens das notas fiscais no modelo transacional apresentado. Deve-se observar ainda que para cada produto, vendido numa loja num certo dia teremos um registro. Olhando assim, parece que o DW no ser muito grande, mas na prtica teremos muito mais dimenses, o que aumentar significativamente o tamanho da tabela de Fato.
16
Pontos Relevantes...
Mais que isso o fato ProdutosComercializados habitualmente armazenar cada item vendido (dimenso Nota Fiscal) e tambm promover agrupamentos por tipos como linhas e regies. Assim a tendncia que o fato ocupe muito, mas muito mais espao que as tabelas dimensionais, transformando-se no maior problema que teremos, quer seja pelo espao ocupado, quer seja por alguma eventual dificuldade na obteno de alguma informao pelo motor do banco de dados.
17
Concluso
O modelo apresentado conhecido como Estrela justamente pelo fato estar no centro, ser muito maior que as dimenses (nossos planetas, embora estejam muito mais para Pluto do que para Saturno, pelo seu tamanho em relao ao Sol, nossa estrela).
18
Decorrncias
Embora no possa ser comparado a um modelo real, esse caso dever ter servido para nos dar uma clara ideia dos conceitos iniciais e permite vislumbrar os que ainda sero apresentados. Devemos, nesse instante, termos uma ideia mais clara do que ocorre, efetivamente, quando um cubo girado, por exemplo.
19
Negcio: Supermercado com 100 lojas, espalhadas por 5 estados americanos. Cada loja possui departamentos completos, incluindo mercearia, congelados, leiteria, padaria, entre outras reas. Cada loja possui 60.000 produtos individuais (SKU Stock Keeping Units, unidades de estoque). 55.000 das SKUs possuem cdigos de barra. Os demais itens so produzidos internamente (aougue, florais, padaria, entre outros), mas recebem cdigos internos, que no so UPCs (Universal Product Codes Cdigos Universais de Produtos).
Nota: Este exemplo, criado por Kimball, ser detalhado em aula posterior.
20
21
22
23