Escolar Documentos
Profissional Documentos
Cultura Documentos
prof.anderson@ica.ele.puc-rio.br
Anderson Nascimento linkedin: profandersonnascimento
Tópicos
• Introdução a Modelagem Multidimensional;
• Definição da Arquitetura do DW;
• Tipos de Implementação;
• Granularidade de Dados;
• Modelagem Transacional x Multidimensional;
• Tabela Fato;
• Tabela Dimensão;
• Hierarquias de Dimensão;
• Métricas;
• Exercício 04;
• Modelo Estrela (Star Schema);
• Modelo Floco de Neve (Snowflake);
• Pontos Cardeais;
• Estudo de Caso;
• Exercício 05; 2 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Introdução a Modelagem Multidimensional
• Trata-se da modelagem utilizada para a elaboração do projeto de Date Warehouse;
• A modelagem de dados para o data warehouse é completamente diferente da modelagem de dados para os sistemas transacionais;
• Os dados dos sistemas transacionais não devem apenas serem migrados para o data warehouse;
• Isso ocorre porque o modelo de dados dos sistemas transacionais é construído obedecendo a terceira forma normal e, por isso, não
responde com rapidez a questões típicas de consultas de apoio a decisão.
• Tipos de abordagem
• Top down;
• Bottom up;
• Combinada;
Modelagem Multidimensional - Prof. Anderson Nascimento 5 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Definição da Arquitetura do DW
• Arquitetura Física
• On-Premises;
• VPS (Virtual Private Server);
Modelagem Multidimensional - Prof. Anderson Nascimento 6 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Definição da Arquitetura do DW
• Arquitetura Global
Suporta as necessidades da
organização, utilizada por todos os
departamentos da empresa
Top Down DW
DW
Bottom Up
DM1 DM2 DM3
A “maldição do sucesso”
Modelagem Multidimensional - Prof. Anderson Nascimento 15 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Definição da Arquitetura do DW
• Arquitetura Física
• VPS (Virtual Private Server);
• Redundância é default;
• Servidor está fora da empresa;
• Você paga pelo que usa (disco, memória, CPU);
• Paga como um serviço, como água, luz, telefone;
• Não há a necessidade de um capital inicial;
• Escalonamento rápido, um clique!;
• Toda a manutenção é de responsabilidade do provedor do serviço;
Modelagem Multidimensional - Prof. Anderson Nascimento 16 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Granularidade de Dados;
• A granularidade diz respeito ao nível de detalhe do DW;
• Quanto mais detalhe existir, menor será a granularidade; quanto menos detalhes, maior a granularidade;
• A granularidade terá impacto significativo no volume de dados do DW;
1 registro
por mês
Granularidade
Fonte: Machado (2010)
Transacional Multidimensional
Foco controle do negócio gestão do negócio
Conexões elevado número de joins baixo número de joins
Visão dos dados sempre com todos os reestruturados,
detalhes sumarizados
Modelo de dados entendimento mais Entendimento mais fácil
complicado
Exemplos de Fato:
• Aluguel;
• Entradas de material em estoque;
• Compras / Vendas;
• Pedidos;
• Aluno;
• Professor;
• Sala de Aula;
• Disciplina;
• Data de Matrícula;
• Campus;
• Métricas Derivadas;
• São calculadas e geradas a partir de uma outra métrica;
• Pode ser armazenada ou calculada em tempo de execução;
• Métricas Semi-aditivas;
• São aditivas em todas as dimensões, menos a Dimensão Tempo;
• Um exemplo é o saldo em estoque após uma entrada ou uma saída de um produto;
Dimensão
Tempo
Dimensão Dimensão
Cliente Região
Fato venda
Dimensão Dimensão
Vendedor Produto
Dimensão
Tempo Dimensão
Cidade
Dimensão
Estado
Dimensão Dimensão
Cliente Região
Fato venda
Dimensão
Tipo de Produto
Dimensão Dimensão
Vendedor Produto
• É um modelo normalizado que evita redundância de valores textuais em uma tabela de dimensão.
Onde?
Onde?
Onde?
Máquina
40 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Design Patterns do BI
• São convenções que utilizamos no mercado para a nomenclatura de objetos no modelo multidimensional:
44
Exercício 05
• Uma rede de cinemas deseja controlar a evolução do seu público, frente aos filmes que são exibidos por sessão,
desejando realizar um comparativo que inclua gênero, dias da semana e locais de exibição. Construa um modelo
multidimensional que resolveria a demanda da empresa.