Você está na página 1de 41

CA 743 – Projeto de Sistemas de Bancos de Dados

1º Semestre 2022

Modelo Dimensional

Prof. José M. Parente de Oliveira


Profa. Emilia Colonese Carrarrd
Modelo Dimensional
Modelo Estrela:

Dimensão

Dimensão Dimensão
Fato

Dimensão Dimensão

2 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Modelo Dimensional
 Os dados no modelo dimensional mantêm a atomicidade e são
mapeados para uma estrutura de dimensões associadas à valores
mensuráveis, chamadas de Métricas constantes da tabela Fato.
 As métricas estão associadas a um assunto específico (processo de
negócio da empresa) e podem ser analisadas por diferentes aspectos,
representados pelas tabelas Dimensões.
 As tabelas tipo Dimensões categorizam ou agrupam as métricas e são
desnormalizadas possibilitando o processo de roll-up e drill-down sem
a utilização de junções com outras tabelas.

O DW consiste de vários modelos dimensionais com


tabelas dimensão conformadas sendo compartilhadas por
tabelas de fatos corporativas.
3 Prof. José M. Parente de Oliveira 18/05/2022
Profa. Emilia Colonese Carrarrd
Modelo Dimensional: Princípios de Design
Os princípios de design definem consistência nas tabelas de fato e
dimensão, melhoram a qualidade dos resultados analíticos e facilitam
técnicas de análise.
 Dados detalhados
Os dados das dimensões devem ser expressos no maior detalhe possível para possibilitar
flexibilização e extensão de análise.

 Dimensões conformadas
Uma dimensão conformada é uma dimensão com cujo conceito todos os grupos no
empreendimento concordam. Dimensões conformadas permitem caminhos de agregação
reutilizáveis para medidas em diversas tabelas de fatos (Drill Across).

 Fatos corporativos
Um fato corporativo é uma medida, cuja definição pela área de negócio é aceita, entendida e usada
por todas as outras áreas de negócio da empresa.

4 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Modelo Dimensional
A representação em Estrela pode ter variância gerando estruturas mais
complicadas:
 Flocos de Neve: múltiplos níveis das tabelas dimensões.

Dimensão

Dimensão Dimensão
Fato
Dimensão Dimensão

Dimensão Dimensão

Dimensão

5 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Modelo Dimensional
 Modelo de Constelação: múltiplas tabelas de fato.

Dimensão Dimensão

Dimensão Dimensão Dimensão


Fato Fato

Dimensão Dimensão Dimensão Dimensão

6 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Modelo Dimensional: Exemplo
Modelo Estrela do DW de Vendas

Dimensão

Atributo
Métrica

Fato

7 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Modelo Dimensional: Exemplo
Modelo Floco de Neve do DW de Vendas

8 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Modelo Dimensional: Exemplo
Modelo Constelação dos DW de Vendas e Entrega
(duas Atividades, duas Tabelas Fato)

Fato Fato

9 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Granularidade
 É o nível de detalhe ou resumo contido nos dados - quanto mais
detalhes, menor é a granularidade. (Inmon, 1997)
 Representado por um atributo numa dimensão.
 Por exemplo, se for decidido um agrupamento anual ao invés de diário,
para um modelo referente ao nascimento de pessoas, o número de
registros armazenados no banco será bem menor, porém, será
impossível analisar os nascimentos diários ou mensais.

É o atributo determinante da qualidade dos dados


de um DW.

10 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Granularidade: Exemplo

11 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Hierarquia

12 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Modelo de Dados Dimensional

Selecione o processo de • Escopo do Negócio: Qual atividade?


Negócio da Empresa a ser • Qual resultado da atividade do negócio deve
modelado ser medido? Definir as métricas.

• Como a métrica definida para a atividade do


Definição da Granularidade negócio deve ser expressa.

• O que? Para quem? Por quem? Quando?


Identificação das Dimensões e Onde? Como?
seus Atributos • Relacionado ao evento do negócio.

• Armazenam as métricas resultantes da


Identificação dos Fatos atividade do negócio na granularidade definida.

13 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Tabela Fato
 A tabela Fato é a tabela principal do Data Warehouse.
 Conecta-se com as dimensões.
 Armazena:
 Métricas do processo de negócio em foco, que são os eventos
operacionais medidos no mundo real; e
 Chaves estrangeiras (FK), que ligam as tabelas Dimensões com a tabela
Fato.

14 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Tabela Dimensão
 São tabelas geralmente desnormalizadas, com muitos atributos e
hierarquias.
 São conectadas à tabela Fato através de suas chaves primárias.
 As chaves primárias são atribuídas (surrogate keys) e não naturais.
 Contém atributos que servem para especificar constraints e
agrupamentos nas consultas.

15 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Fatos e Dimensões
 Tipos de métricas.
 Principais tipos de tabelas fato.
 Principais tipos de tabelas dimensão.

16 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Tipos de Métricas
 Tudo que a empresa for mensurar sobre o negócio / área de interesse
é uma métrica.
 O tipo de dado das métricas é sempre numérico.
 A métrica é o que o tomador de decisão quer medir. Também chamada
de quantificador ou medida.
 Existem 4 tipos de métricas:
 Aditivas
 Derivadas
 Semi-Aditivas
 Não-aditivas

17 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Métrica Aditiva
 São as métricas que permitem operações matemáticas como soma e
subtração por todas as dimensões.
 As métricas aditivas devem poder efetuar operações com todos os
valores da medida armazenados na tabela Fato, mas precisam fazer
sentido em todas as dimensões.
 O valor da métrica é representativo em todos os cruzamentos com as
dimensões.
 Ela tem que fazer um cruzamento completo e perfeito na linha da fato,
então a métrica precisa fazer sentido com cada uma das dimensões
sozinhas.
Alguns exemplos de métricas aditivas:
• Quantidade de vendas.
• Valor da Venda (se não for calculado).
18 Prof. José M. Parente de Oliveira 18/05/2022
Profa. Emilia Colonese Carrarrd
Métrica Derivada
 São as métricas calculadas.
 São métricas que se calcula para ter um segundo número. Esse cálculo é
sempre em cima de métricas que já estão na fato, não no que está no legado.
 Após calculadas, cria-se uma nova métrica que chamamos de derivada.

#DATA #PRODUTO #CLIENTE #VENDEDOR VALOR_ QTD_ TOTAL_


VENDA VENDA VENDA

10/10/2018 almofada Ana Santos Renato Silva 10,00 3 30,00

Nesse exemplo, a métrica derivada TOTAL_VENDA é a multiplicação da


QTD_VENDIDA com o VALOR_UNITARIO.
OBS:
Os exemplos nestes slides estão com a nomenclatura dos itens, ao invés das
chaves, para facilitar a compreensão.
19 Prof. José M. Parente de Oliveira 18/05/2022
Profa. Emilia Colonese Carrarrd
Métrica Semi-Aditiva
 A métrica semi-aditiva pode ser computada por todas as dimensões
exceto a tempo.
 Para computar esta métrica pela dimensão tempo deve-se colocar um
filtro indicando qual ou quais registros serão computados.
 Saldo de estoque e saldo bancário, quando representado de forma
monetária, são métricas semi-aditivas bem comuns, porque são aditivas
em todas as dimensões, exceto na tempo.

20 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Métrica Não-Aditiva
 A métrica não-aditiva não pode ser computada por nenhuma
dimensão.
 São métricas tipo percentual, ou algum cálculo feito em tempo de
execução, que não podem ser somadas por nenhuma dimensão.
 O ideal é salvar as métricas que levam àquela não-aditiva e deixar para
que ela seja calculada na ferramenta de consulta.

21 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Principais Tipos de Tabelas Fato
 Fato transacional
 Fato agregada
 Fato consolidada
 Fato sem fato

22 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Fato Transacional
 Tabela fato transacional é a mais comum.
 A maioria dos bilhões de linhas que temos em um Data Warehouse
são provenientes de uma fato transacional.
 Ela geralmente utilizam métricas aditivas, aquelas métricas que podem
somar por todas as dimensões. Podem também ter métricas derivadas.
#DATA #PRODUTO #CLIENTE #VENDEDOR #PEDIDO VALOR_ QTD_ TOTAL_
VENDA VENDA VENDA

10/10/2018 almofada Ana Santos Renato Silva 12345 10,00 3 30,00

OBS:
1. As colunas chaves das dimensões não serão os atributos chaves das
tabelas definidas no modelo relacional. No DW são criadas surrogate keys.
2. O código do pedido (#PEDIDO) é uma dimensão degenerada.

23 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Fato Agregada
 Tem a função de acelerar o desempenho das consultas.
 Também utiliza métricas aditivas e também pode utilizar métricas
derivadas.
 São agregadas numa outra granularidade.
#DATA #PRODUTO #CLIENTE #VENDEDOR TOTAL_ TOTAL_
QTD_ VALOR_
VENDA VENDA

10/2018 almofada Ana Santos Renato Silva 10 300,00

agregada

derivada e agregada

24 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Fato Consolidada
 Esse tipo é bem parecido com a fato agregada e serve para combinar
2(dois) tipos de processos de negócio (área de negócio ou área de
interesse).
 A fato consolidada consolida métricas de duas tabelas fatos.
#DATA #PRODUTO #CLIENTE #VENDEDOR TOTAL_ TOTAL_ TOTAL_
QTD_ QTD_ VENDA
VENDIDA ENTREGUE

10/2018 almofada Ana Santos Renato Silva 10 10 300,00

Métrica que vem da Fato Entrega

OBS:
A granularidade deve ser a mesma na junção das duas fatos, a qual deve
ser resolvida no processo ETL.
25 Prof. José M. Parente de Oliveira 18/05/2022
Profa. Emilia Colonese Carrarrd
Fato sem Fato
 É uma tabela Fato sem métricas.
 Também chamada Fato de Associação ou de Interseção.
 Faz uma intersecção de dimensões.
 Essa tabela Fato é uma exceção, e só é usada quando se precisa fazer
uma interseção entre as dimensões.

Dois exemplos de Fato sem Fato: Frequência de aluno e Promoção em Vendas.


Exemplo 1: Frequência em Curso.
Temos as tabelas dimensão aluno, curso, professor e tempo. Temos a tabela fato frequência.
O objetivo dessa fato é fazer a associação entre as dimensões.
Ou seja, quero comparar os alunos com os cursos, os alunos com os professores, o tempo com o
curso, o curso com o professor, e por aí vai, mas não tem nenhuma métrica envolvida.
Exemplo 2: Promoção em Vendas.
Temos uma tabela fato que armazena dados de vendas promocionais, com isso, podemos
analisar o que vendeu ou o que não vendeu em uma promoção.

26 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Principais Tipos de Tabelas Dimensão
 Dimensão Conformada
 Dimensão Degenerada
 Dimensão Slowly Changing
 Dimensão Role-Playing

27 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Dimensão Conformada
Dimensão Conformada é uma dimensão que tem o mesmo
significado para todas as tabelas fatos com as quais se relaciona.

 Todos devem falar a mesma língua na empresa, para que exista


consistência dos dados e integração entre os diversos processos de
negócio.
 Numa dimensão conformada as tabelas fatos e suas respectivas
métricas são classificadas e descritas da mesma forma em toda a
empresa, ou seja, existe uma padronização da informação.

28 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Dimensão Degenerada
É uma dimensão que não foi materializada numa tabela
Dimensão e sim inserida como uma coluna na tabela Fato
(geralmente como métrica não-aditiva).

 É usada quando a granularidade de uma tabela Fato representa os


dados à nível transacional, e se deseja manter identificadores
específicos do sistema sem forçar a sua inclusão numa dimensão.

Exemplos: - número do pedido de uma venda


- número da fatura de um pedido
- número da NFE

29 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Dimensão Slowly Changing (DSC)
É uma dimensão que precisa ser atualizada para se manter
sincronizada com o BD Transacional.
 Todas as dimensões são DSC, mas diferenciadas por tipos.
 Na Tipo 0, após a inserção dos dados ela não sofre mais atualização. Exemplo:
dimensão tempo.
 Na Tipo 1, todas as colunas são iguais à tabela de origem e quando o dado é
alterado na tabela de origem, ele também será alterado na dimensão
relacionada.
 Na Tipo 2 além de todas as colunas serem iguais à tabela de origem, possuem
mais 3 atributos: a data inicial, a data final e um atributo tipo “flag” para indicar
se o registro contém a informação atual.
 Mantêm um controle histórico da informação.
 Quando existe atualização uma nova linha é inserida na dimensão.
30 Prof. José M. Parente de Oliveira 18/05/2022
Profa. Emilia Colonese Carrarrd
Dimensão Role Playing
É uma dimensão que é referenciada mais de uma vez na tabela
Fato para múltiplos objetivos.
Exemplo: a quantidade vendida deve ser analisada tanto pela data de venda
quanto pela data de entrega.
Neste caso, precisamos ter as chaves (FK) dessas datas na Fato. Para isso,
referenciamos duas vezes a dimensão tempo com os nomes das FK diferentes.

31 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Transformação do Modelo Relacional para Dimensional
 Classificar as tabelas em Transacional, Componente e Classificação.
 Tabelas transacionais geram tabelas Fatos.
 Tabelas componentes são tabelas diretamente ligadas à tabela transacional
e são candidatas a serem dimensões (geram dimensões reais ou
degeneradas).
 Tabelas de classificação são diretamente ligadas à uma tabela componente
(descrevem hierarquias ou categorizam dados das tabelas componentes).

 Adição de uma dimensão de tempo no modelo.

 Remoção de tabelas e dados puramente operacionais (não são úteis


para a análise).

32 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Transformação do Modelo Relacional para Dimensional
 Introdução de dados derivados na tabela fato (se necessário).
 Transformação de dados de tabelas das tabelas de classificação
relacionadas com as tabelas componentes ou que formam cadeias de
tabelas de classificação, em artefatos dos dados nas dimensões,
formando um modelo dimensional do tipo estrela; ou mantidas numa
dimensão separada, formando um modelo dimensional do tipo floco de
neve.
 Criação da tabela fato com o nível de granularidade especificado.
 O esquema pode ter nível de granularidade diferente das granularidades do
modelo relacional.
 Todas as tabelas do esquema devem estar conformadas com a
granularidade especificada.

33 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Transformação do Modelo Relacional para Dimensional
 Caso especial 1: entidades não transacionais com relacionamento original N-
N, representado no modelo lógico na forma de tabela.
Modelo Relacional
Produto Fornecedor_Produto Fornecedor
# ID Produto # ID Fornecedor # ID Fornecedor
Descrição # ID Produto Nome Fornecedor
Unidade de Medida Endereço Fornecedor
Preço Base

Pode gerar um modelo floco de neve!

Produto
Fornecedor-Produto Modelo Dimensional
# ID Produto
Descrição # ID Produto
Unidade de Medida # ID Fornecedor
Preço Base Nome Fornecedor
Endereço Fornecedor

34 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Transformação do Modelo Relacional para Dimensional
 Caso especial 2: entidades transacionais tipo master-detail ou pai-filho.

Pedido Item_Pedido Modelo Relacional


# ID Pedido # ID Pedido
Data Venda # ID Item
Cod Cliente Cod Produto
Cod Vendedor Qtd Vendida
Dado Observações Valor Venda
Operacional

Geram uma Única Tabela FATO!


Venda
Granularidade da Dimensão Tempo # ID Tempo Modelo Dimensional
(pode ser diferente do evento # Cod Cliente
transactional) # Cod Vendedor
# Cod Produto
Dimensão Degenerada ID_Pedido
Qtd Venda
Valor Venda
Métrica Derivada (Qtd * Valor) Total Valor Venda

35 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Modelo Dimensional da Universidade

36 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Requisitos de Informação da Universidade
 A universidade oferece cursos.
 Cursos possuem um identificador, um título, e uma descrição.
 A cada vez que um curso é oferecido é chamado de seção (conhecido
também como turma), e são cadastrados um semestre, um ano, uma data de
início e de uma de término.
 Quando um curso é oferecido (seção ou turma), um instrutor é designado
para ministrar o curso.
 Cada instrutor possui identificador e um nome. Um instrutor pode ser
classificado como efetivo ou temporário. Se o instrutor for efetivo ele recebe
um salário, se temporário recebe por hora.
 Estudantes se registram em um curso oferecido (seção ou turma) e recebem
uma nota ao final do curso.
 Estudantes tem um identificador, um nome e uma data de nascimento.

37 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Mapa Conceitual da Universidade

38 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
MER da Universidade

* Desenvolvido com a
Ferramenta brModelo

MER Notação Chen

39 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Modelo Relacional Universidade

* Desenvolvido com a
Ferramenta ERwin

Notação: IE / Pé de Galinha

40 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd
Referências
 Kimball, R.; Ross, M. The Data Warehouse Toolkit: The Definitive Guide
to Dimensional Modeling, Third Edition. John Wiley & Sons, Inc., 2013.

42 Prof. José M. Parente de Oliveira 18/05/2022


Profa. Emilia Colonese Carrarrd

Você também pode gostar