Escolar Documentos
Profissional Documentos
Cultura Documentos
Modelagem Dimensional
BI como tecnologia
Dados de Origens
Cadastros Bsicos
Sistemas Legados
Movimentos
C A M E A T D L A E T L
Data Warehouse
C A M A D A E T L
Cubos
Relatrios Data Mining Query Aplicaes Analticas Planejamento Financeiro
Data Marts
Data Marts
ERP ERP
ODS
Stage Area
Planilhas
Camadas de Integrao
O que Sistema que armazena dados histricos usados no processo de tomada de deciso. Integra os dados corporativos de uma empresa em um nico repositrio.
Para que serve ? Criar uma viso nica e centralizada dos dados que estavam dispersos em vrios BDs Usurios finais podem executar consultas, gerar relatrios e efetuar anlises.
Mostra dados histricos e atuais; Podem ser cruzados; Podem ser sumariados; Deve estar sobre um Metadados (vamos ver a frente)
Data Warehouse
Alta Adminstrao Decises Estratgicas Dificil de Prever Com base em Anlise de Dados Valores Histricos e Imutveis Sumarizado Orientado ao Assunto
Modelos
O modelo deve representar o negcio, de modo simples. Todos os projetos de BI devem comear : Com o processo de negcio que gera as medidas numricas de desempenho; Especificar a granularidade exata desses dados; Envolver essas medidas com dimenses que so verdadeiras.
Modelos
Facilidade constante do usurio
Como Montar ? O que escolher ? Quais so as mtricas ? Complexidade ? Dimenses so mutveis ? Tabelas de Agregao (Preciso delas ?)
Modelos
Impossibilidade de fechamento de escopo Alteraes que o cliente vai sugerindo. Soluo no tinha sido bem pensada. Sugesto que a prpria equipe oferece
Porque , para a tomada de deciso, mais e mais aspectos podem e devem ser incorporados.
Origens
Modelos
Camada de Integrao
Mainframe
DW
ETL
Data Marts
ERP
Camada de Integrao
Legados
Staging Area:
Parte do Data Warehouse responsvel por receber a extrao, transformao e carga (ETL) das informaes dos sistemas transacionais legados, para posterior gerao dos Data Marts de destino;
A Staging Area considerada rea fora do acesso dos usurios; A Staging Area no deve suportar queries dos Usurios;
Ela pode ser composta por flat files (arquivos textos) ou tabelas de banco de dados na terceira forma normal (normalizadas);
Principais Caractersticas
De acordo com a definio dada por Inmon, um Data Warehouse deve ser : Orientado ao assunto Integrado No-Voltil Varivel com o tempo.
Modelos
Origens Vantagens das camadas de Integrao Evita repetio da Extrao Garante Padro
Mainframe
ETL
DW Data Marts
ERP
Legados
Staging rea
ODS
Staging rea rea de importao de dados dos sistemas transacionais; Relacional e normalizada; Geralmente igual s tabelas transacionais com dados necessrios carga.
Operacional Data Store rea de consolidao e limpeza dos dados. Verificao de integridade. Relacional e normalizada. rea no obrigatria, depende da quantidade de transformaes.
Modelo Dimensional rea de apresentao dos dados; Modelada para performance em consultas; Conceitos de Ralph Kimball; Possui tanto informaes mais atmicas a nveis mais agregados.
Obs: podem ser utilizados outros modelos para extrao de dados por ferramentas, mas a melhor performance se encontra em modelos Star Schema.
Origens
DW
Mainframe
ETL
ERP
Data Marts
Legados
ODS
Camada de Integrao
Num. Depto.
1 2
Departamento
Financeiro Operaes
Cidade
1 2 3
Nome
Bauru Campinas So Paulo
Departamento 1 2
Localizao do Departamento 2
223
399
Antonio 1
1
3
Klingon Warrior
Shooting Star
Tulipa
Modelagem Multidimensional
Conceito Concepo e visualizao de um modelo de dados referente a conjuntos de medidas que descrevem aspectos comuns de negcios; Tcnica utilizada para se ter uma viso multidimensional dos dados, modelados em uma estrutura dimensional, conhecida como cubo.
Modelagem Multidimensional
Dimenso
Modelagem Multidimensional Fato Coleo de itens de dados de medida e contexto; Cada fato representa um item, uma transao ou um evento de negcio; representado por uma tabela de fatos. Exemplos: Conjunto de vendas de uma loja; Evoluo de faturamento de uma empresa; Comerciais exibidos na televiso;
Modelos
Modelagem Multidimensional
Dimenso Elementos que participam de um fato; Determina o contexto de um assunto de negcio; So descritivas e classificatrias; representada por uma tabela de dimenses;
Exemplos: Cliente, Produto, Vendedor; Anunciante, Produto, Agncia, Data, Hora; Regio, UF, Cidade, Bairro.
Modelos
Modelagem Multidimensional
Medida Atributos numricos que representam um fato; Representam uma performance de um indicador de negcio relativo as dimenses de um fato; determinada pela combinao das dimenses; Exemplos: Quantidade da produtos vendidos; Valor das vendas;
O Inicio
Comeo analisando o modelo atual ou modelando o Data Mart por suas necessidades? Em primeiro lugar vamos eliminar aqui, uma inverdade que Fornecedores apresentam: Transforma-se o modelo de dados ER do sistema transacional em modelos de dados Star Schema(estrela) utilizando uma ferramenta case de modelagem. Isto no possvel. Dados de um Data Mart no so dados do Sistema Transacional. Deve-se ter completa independncia do modelo relacional dos Sistemas Transacionais
Portanto
executivas,
Identificando o Fato. Qual o fato desta necessidade? O que nos d idia de ao nesta solicitao? O que se caracteriza por ter medidas? O que medido?
Vantagens Alta performance de consulta; Baixa complexidade de modelagem; Controle de Histricos; Alta integridade. Desvantagens Baixa performance de carga; Alta redundncia de dados.
Linha
Snow Flake
Familia
Classe
Cores
Produtos
Vendas
Cliente
Dia
Preos
Mes
Ano
Linha
Cores
Id_cor Nome_cor
Modelo Floco de Neve Consiste na decomposio das tabelas de dimenses em hierarquias; Aplicao da 3FN nas tabelas; Os desenvolvedores freqentemente elegem o modelo SnowFlake pelo fato de preservar a utilizao de meios de armazenamento.
Modelos
Modelos
Vantagens Alta performance de cargas; Alta complexidade de modelagem; Controle de Histricos; Alta integridade. Desvantagens Baixa performance de consultas; Alta redundncia de dados.