Você está na página 1de 47

Business Intelligence

Aula 02 – Projeto de Data Warehouse e Modelagem Multidimensional

prof.anderson@ica.ele.puc-rio.br
Anderson Nascimento linkedin: profandersonnascimento
Tópicos
• Introdução a Modelagem Multidimensional;
• Definição da Arquitetura do DW;
• Tipos de Implementação;
• Granularidade de Dados;
• Modelagem Transacional x Multidimensional;
• Tabela Fato;
• Tabela Dimensão;
• Hierarquias de Dimensão;
• Métricas;
• Exercício 04;
• Modelo Estrela (Star Schema);
• Modelo Floco de Neve (Snowflake);
• Pontos Cardeais;
• Estudo de Caso;
• Exercício 05; 2 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Introdução a Modelagem Multidimensional
• Trata-se da modelagem utilizada para a elaboração do projeto de Date Warehouse;

• A modelagem de dados para o data warehouse é completamente diferente da modelagem de dados para os sistemas transacionais;

• Os dados dos sistemas transacionais não devem apenas serem migrados para o data warehouse;

• Isso ocorre porque o modelo de dados dos sistemas transacionais é construído obedecendo a terceira forma normal e, por isso, não
responde com rapidez a questões típicas de consultas de apoio a decisão.

3 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Definição da Arquitetura do DW
• A definição da arquitetura de um DW é uma importante fase que vai guiar todo o projeto;

• Mudanças na arquitetura ao longo do processo é algo caro;

• A arquitetura está diretamente relacionada com a empresa;


• Tempo de execução;
• Infraestrutura disponível;
• ROI;
• Escopo;
• Recursos disponíveis;
• Capacitação dos profissionais;
• Benefícios da utilização dos resultados;
• Velocidade de implementação;
• Amplitude de atendimento na empresa; 4 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Definição da Arquitetura do DW
• Tipos de Arquitetura
• Global;
• Independente;
• Integrada;

• Tipos de abordagem
• Top down;
• Bottom up;
• Combinada;

Modelagem Multidimensional - Prof. Anderson Nascimento 5 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Definição da Arquitetura do DW
• Arquitetura Física
• On-Premises;
• VPS (Virtual Private Server);

Modelagem Multidimensional - Prof. Anderson Nascimento 6 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Definição da Arquitetura do DW
• Arquitetura Global
Suporta as necessidades da
organização, utilizada por todos os
departamentos da empresa

- Necessidades da empresa como um todo;


- Visões corporativas dos dados;
- Mais tempo para desenvolvimento e administração;
- Custo de implementação alto;

7 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Definição da Arquitetura do DW
• Arquitetura Independente
Necessidades departamentais, não há
conectividade com outros

- Implementação rápida; Não há foco corporativo


- Não permite uma visão global;
- Encanta os usuários;

8 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Definição da Arquitetura do DW
• Arquitetura Integrada
Data Marts são implementados
separadamente, mas há integração

- Há aspectos corporativos; Arquitetura mais complexa


- Usuários podem acessar dados de outros data marts;
- Há compartilhamento de dados entre os data marts;

9 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Definição da Arquitetura do DW
• Abordagem Top Down

Top Down DW

DM1 DM2 DM3

10 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Definição da Arquitetura do DW
• Abordagem Top Down
Vantagens Desvantagens

Herança de Arquitetura Implementação longa

Visão de empreendimento Alta taxa de risco

Metadados simples Necessidade de cruzamentos funcionais

Controle de centralização de regras Aumento das expectativas

11 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Definição da Arquitetura do DW
• Abordagem Bottom Up

DW

Bottom Up
DM1 DM2 DM3

12 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Definição da Arquitetura do DW
• Abordagem Bottom Up
Vantagens Desvantagens

Implementação rápida Podem ocorrer redundâncias e inconsistências

Retorno rápido Dificuldade em gerenciar os metadados

Foco no problema Processo de extração crítico devido a quantidade de


data marts
Redução do risco Projeto pode virar um “legamarts”

A “maldição do sucesso”

13 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Definição da Arquitetura do DW
• Abordagem Combinada
Vantagens Desvantagens

Modelo único para os data marts Data marts inflexíveis

Consistência dos dados Coordenação difícil

Data Marts evolutivos Necessário tempo maior para a entrega do projeto

Coerência entre os data marts

14 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Definição da Arquitetura do DW
• Arquitetura Física
• On-Premises;
• Configurações dependem da própria empresa (no breaking, backup, customização, implementação, atualizações);
• Segurança depende da empresa (incidentes, incêndio, chuva, furtos, roubos, tragédias naturais);
• Alto investimento de Hardware e Software, principalmente se for apenas para o BI;
• Um servidor simples 10k;
• Redundância é cara, e não garante 100% de segurança. Imagina a redundância dentro de uma mesma sala, um mesmo
ambiente!

Modelagem Multidimensional - Prof. Anderson Nascimento 15 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Definição da Arquitetura do DW
• Arquitetura Física
• VPS (Virtual Private Server);
• Redundância é default;
• Servidor está fora da empresa;
• Você paga pelo que usa (disco, memória, CPU);
• Paga como um serviço, como água, luz, telefone;
• Não há a necessidade de um capital inicial;
• Escalonamento rápido, um clique!;
• Toda a manutenção é de responsabilidade do provedor do serviço;

Modelagem Multidimensional - Prof. Anderson Nascimento 16 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Granularidade de Dados;
• A granularidade diz respeito ao nível de detalhe do DW;
• Quanto mais detalhe existir, menor será a granularidade; quanto menos detalhes, maior a granularidade;
• A granularidade terá impacto significativo no volume de dados do DW;

17 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Granularidade de Dados

1 registro
por mês

Granularidade
Fonte: Machado (2010)

18 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Modelagem Transacional x Multidimensional
• A modelagem multidimensional vai guiar todo o processo de ETL para a construção do DW;
• A modelagem multidimensional é mais simples, expressiva e mais fácil de entender que a modelagem transacional;
• Um modelo multidimensional é formado por 3 elementos básicos: fatos, dimensões e medidas;
• Ambos os modelos normalmente vão coexistir em uma organização que tenha um processo de BI;

19 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Modelagem Transacional x Multidimensional
• Comparativo:

Transacional Multidimensional
Foco controle do negócio gestão do negócio
Conexões elevado número de joins baixo número de joins
Visão dos dados sempre com todos os reestruturados,
detalhes sumarizados
Modelo de dados entendimento mais Entendimento mais fácil
complicado

20 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Tabela Fato
• Coleção de itens de dados que correspondem um item, uma transação ou o evento do negócio que se está analisando;
• Reflete a evolução do negócio no dia-a-dia de uma organização;
• O fato é um dos pontos mais delicados de um projeto de DW;
• Trata-se de um assunto ao qual necessitamos possuir informações históricas para compreensão e tomada de decisão;

Exemplos de Fato:

• Aluguel;
• Entradas de material em estoque;
• Compras / Vendas;
• Pedidos;

21 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Tabela Dimensão
• São os elementos que participam do fato, as características daquele fato em si;
• São utilizados como filtros nas consultas;
• Normalmente não apresentam atributos numéricos, pois são descritivas e classificatórias;

Exemplos de Dimensão em uma Universidade:

• Aluno;
• Professor;
• Sala de Aula;
• Disciplina;
• Data de Matrícula;
• Campus;

22 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Dimensão Degenerada
• São dimensões que não possui relevância suficiente em termos de detalhamento para ser considerada uma dimensão;
• Normalmente são relegadas a uma coluna na tabela Fato;
• Exemplo: o código de uma venda;

23 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Dimensão Conformada
• Dimensões que se relacionam com várias tabelas Fato;
• Normalmente traz todos os campos que as Fatos precisam;
• Um exemplo seria a Dimensão Aluno em uma Universidade;

24 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Dimensão Role-Playing
• Dimensões que podem ser usadas para vários objetivos;
• Um exemplo seria uma mesma Dimensão Tempo ser usada para atender várias datas na Tabela Fato, como por exemplo, data da
reserva, data do aluguel e data da devolução de um livro em uma biblioteca;

25 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Hierarquias de Dimensão
• As tabelas de dimensão, em sua maioria, são compostas por hierarquias de atributos;
• Classificação dos dados em uma dimensão;
• Exemplos de hierarquia:
• Região • Categoria • Ano
• Estado • Subcategoria • Mês
• Cidade • Produto • Dia
• Bairro
• Loja

26 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Hierarquias de Dimensão
• As tabelas de dimensão, em sua maioria, são compostas por hierarquias de atributos;
• Classificação dos dados em uma dimensão;
• Exemplos de hierarquia:
• Região • Categoria • Ano Nível 2
• Estado • Subcategoria • Mês Nível 1
• Cidade • Produto • Dia Nível 0 - Grão
• Bairro
• Loja

27 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Métricas
• Atributos numéricos que representam um fato;
• Sempre estarão na tabela fato do modelo;
• Exemplos de métricas:
• valor em reais das vendas;
• o número de unidades de produtos vendidos;
• a quantidade de estoque;
• o custo de vendas.

28 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Tipos de Métricas
• Métricas Aditivas;
• Seu valor pode ser relacionados com qualquer dimensão, exemplo: vendas por data, por produto, por fornecedor, por cliente;

• Métricas Derivadas;
• São calculadas e geradas a partir de uma outra métrica;
• Pode ser armazenada ou calculada em tempo de execução;

• Métricas Semi-aditivas;
• São aditivas em todas as dimensões, menos a Dimensão Tempo;
• Um exemplo é o saldo em estoque após uma entrada ou uma saída de um produto;

• Métrica Não –Aditiva


• Não podem ser somadas por nenhuma dimensão;
• São expressas normalmente em percentual;
• Um exemplo: o percentual que uma saída representa sobre uma entrada em uma movimentação bancária
29 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Exercício 04
• Observe o modelo multidimensional a seguir e destaque:
• Tabela Fato:
• Tabelas Dimensão:
• Medidas:
• Hierarquias:

30 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Modelo Estrela (Star Schema)
• A sua composição típica possui a entidade central fato e um conjunto de dimensões arranjadas ao redor da
entidade central, formando uma estrela;

Dimensão
Tempo

Dimensão Dimensão
Cliente Região
Fato venda

Dimensão Dimensão
Vendedor Produto

31 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Modelo Estrela (Star Schema)
• O relacionamento entre dimensão é sempre de um para muitos a partir da tabela fato;
• Exemplo:

Modelo estrela para uma locadora de veículos

32 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Modelo Floco de Neve (Snowflake)
• É o resultado da decomposição de uma ou mais dimensões que possuem hierarquias entre seus membros;

Dimensão
Tempo Dimensão
Cidade
Dimensão
Estado
Dimensão Dimensão
Cliente Região
Fato venda

Dimensão
Tipo de Produto
Dimensão Dimensão
Vendedor Produto

33 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Modelo Floco de Neve (Snowflake)
• Ele define relacionamentos muitos para um entre os membros de uma dimensão, formado por meio de relacionamentos
entre entidades dimensão de uma hierarquia;

• É o resultado da aplicação da terceira forma normal sobre as entidades dimensão;

• É um modelo normalizado que evita redundância de valores textuais em uma tabela de dimensão.

34 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Modelo Floco de Neve (Snowflake)
• Exemplo:

Modelo floco de neve para uma oficina

35 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Pontos Cardeais
• É uma metáfora que alude às dimensões presentes no modelo multidimensional e o seu relacionamento com o fato;
• Ajuda na orientação da definição do modelo multidimensional;
• As dimensões dos pontos cardeais são:
• Quem?
• Quando?
• Onde?
• O que?

36 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Pontos Cardeais
O que?

Quando? Fato Quem?

Onde?

37 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Pontos Cardeais
• Exemplo:
• Em uma indústria produz-se uma vasta linha de produtos. A produção de determinado produto ocorre em uma
máquina, que é operada por um funcionário, que produz peças em um determinado período de tempo.
• Baseado nos pontos cardeais, qual é o fato e quais são as dimensões?

38 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Pontos Cardeais
O que?

Quando? Fato Quem?

Onde?

39 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Pontos Cardeais
O que?
Produto

Quando? Fato Quem?


Data Produção Funcionário

Onde?
Máquina
40 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento
Design Patterns do BI
• São convenções que utilizamos no mercado para a nomenclatura de objetos no modelo multidimensional:

• SK – Surrogate Key (chave artificial);


• NK – Natural Key (chave natural);
• DD – Dimensão degenerada;
• DT – Data;
• NM – Nome;
• DIM – Prefixo da Tabela Dimensão;
• FT – Prefixo da Tabela Fato;

41 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Ferramentas
• O profissional deve optar por uma ferramenta para apoiar a construção do modelo multidimensional;
• Existem várias no mercado, como o Astah e o Power Architect;
• A Diferença é que o Astah é estática e o Power Architect é dinâmica, permitindo gerar os códigos para criar os objetos no projeto;
• Em nosso material há um vídeo mostrando a criação do modelo com o Astah;
• Você pode fazer o download do Power Architect no endereço: http://www.bestofbi.com/page/architect_download_os
• Já o Astah, teve a sua versão Community descontinuada em 2018, para ter a nova versão para estudantes é necessário criar um
cadastro em http://astah.net/student-license-request

42 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Estudo de Caso 03
• Uma loja de calçados deseja construir um data warehouse para entender melhor o seu estoque. Deseja-se analisar informações sobre
suas mercadorias, filiais e fornecedores. A partir da ideia de um modelo transacional básico (não fornecido para esse exercício),
construa um modelo multidimensional que atenda a atual demanda do lojista.

43 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Resposta do Estudo de Caso

44
Exercício 05
• Uma rede de cinemas deseja controlar a evolução do seu público, frente aos filmes que são exibidos por sessão,
desejando realizar um comparativo que inclua gênero, dias da semana e locais de exibição. Construa um modelo
multidimensional que resolveria a demanda da empresa.

45 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Resposta do Exercício

46 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento


Bibliografia
• Livro
• Machado, Felipe Nery Rodrigues. Tecnologia e Projeto de Data Warehouse: uma visão multidimensional – 5ª ed. São Paulo: Érica,
2010.
• Artigo
• Nascimento, Anderson. O que é preciso antes de iniciar um projeto de Business Intelligence, 2010.
http://www.insightdataservices.com.br/o-que-e-preciso-saber-antes-de-iniciar-um-projeto-de-business-intelligence/ Acesso em:
28/11/2018.

47 Projeto de DW e Modelagem Multidimensional - Prof. Anderson Nascimento

Você também pode gostar