Você está na página 1de 3

Conceitos Bsicos do DW

Sistema Fonte (Source System)


Um sistema operacional cuja funo capturar as transaes do negcio.
Principais prioridades: disponibilidade e performance
Possue chaves tais como chave de produtos e clientes
Data Staging Area
Uma rea de armaenamento e um conjunto de processos !ue limpam"
transformam" e preparam os dados da fonte para uso no data warehouse.
#o necessariamente utilia dados relacionais.
$la no prov% servios de consulta e apresentao.
Servidor de Apresentao
& m!uina f'sica alvo no !ual o data (arehouse organiado e armaenado
para consulta direta pelos usurios finais" geradores de relatrios" e outras
aplicaes
Pode estar organiada no formato de es!uemas estrelas ou de cubos
dimensionais
Modelo Dimensional
Uma disciplina espec'fica para modelagem de dados !ue uma alternativa )
modelagem entidade*relacionamento
+bjetivos: compreenso dos dados e fle,ibilidade para mudanas
Principais componentes: tabelas de fatos e tabela de dimenses
-abela de fatos
-abela principal em todo modelo dimensional !ue contem medidas sobre o
negcio .fatos/
+s fatos mais 0teis so numricos e aditivos
1epresenta relacionamentos muitos pra muitos
2ontm um conjunto de duas ou mais chaves estrangeiras para a juno das
respectivas tabelas de dimenses
-abela de 3imenso
2omplementam as tabelas de fatos
& maioria contm muitos atributos te,tuais !ue so a base para restringir e
agrupar dentro de consultas ao data (arehouse
2ada dimenso definida por sua chave primria !ue serve de base para
restries de integridade referenciais nas tabelas de fatos.
rocesso de !eg"cios
Um conjunto coerente de atividades de negcio !ue faem sentido para os
usurios de negcios do data (arehouse.
$,emplos: processamentos de pedidos" gerenciamento de clientes" etc.
Pode ser considerado como um agrupamento 0til de recursos de informao
com um tema coerente.
Data Mart
Um subconjunto lgico do data (arehouse completo
+ data (arehouse constituido da unio de todos os seus data marts
Pode ser visto como a restrio do data (arehouse a um 0nico
processo de negcios
&bordagem de construo
-op*do(n
4ottom*up
1ecomendaes:
-odo data mart deve ser representado por um modelo dimensional e todo
data mart deve ser constru'do de dimenses e fatos 5em conformidade6
possibilitando seu re*uso
Projetar com um mi, de top*do(n e botton*up design
Data Ware#ouse
& fonte consultvel de dados da empresa.
Pode ser visto como a unio de todos os data marts
7 alimentado pela rea de data staging
7 fre!8entemente atualiado de uma forma controlada
$,ige programao
$%A ($n&%ine Analytic rocessing)
& atividade de consultar e apresentar dados te,tuais e numricos dos
data (arehouses em um estilo dimensional espec'fico
9uase sempre baseado em um cubo de dados multidimensional
e,pl'cito
1+:&P
Um conjunto de interfaces e aplicaes !ue do a um banco de dados
relacional um 5sabor6 dimensional
;+:&P
Um conjunto de tecnologias de interfaces" aplicaes" e bancos de
dados proprietrios !ue t%m um forte vis multidimensional
$utras de'ini(es
&plicao de Usurio <inal
Uma coleo de ferramentas !ue consultam" analiam e apresentam
informao direcionada ao suporte )s necessidades do negcio.
&plicaes de ;odelagem
Um tipo espec'fico de cliente do data (arehouse com capacidades
anal'ticas !ue transformam ou digerem a sa'da do data (arehouse
$,emplos: aplicaes de predio" de agrupamento" de minerao
;etadados
=nformao sobre os dados do data (arehouse !ue no o dado
propriamente dito
rocessos Bsicos do Data Ware#ouse
$,trao
:er e entender o dado fonte e copiar partes !ue so necessrias para a
rea de data staging no futuro
-ransformao
:impar os dados atravs de:
2orreo de erros de digitao
1esoluo de conflitos
-ratamento de dados perdidos
2onverso para formatos padro
1emoo de campos selecionados de dados legados !ue no so
uteis para o data (arehouse
2ombinao de fontes de dados atravs de casamento e,ato em
valores chave ou casamentos 5fu>6 em atributos no*chave
2riao de chaves surrogate para cada registro de dimenso de forma
a evitar a depend%ncia em chaves legadas"
2onstruo de agregados para melhoria de performance em consultas
comuns
2arregamento e =nde,ao
$nvolve a replicao das tabelas de dimenses e fatos e a
apresentao dessas tabelas para as facilidades de ingesto de cada
data mart
#ormalmente efetuado em um 0nico passo de carga
+ data mart alvo tem !ue inde,ar os novos dados para garantir
performance
2hecagem de 9ualidade
$fetuada rodando ferramentas de relatrio de e,cees sobre o
conjunto de dados carregados
2hecar por inconsist%ncias em contagens" somas" sries de tempos
<erramentas de relatrio de e,cees v%m normalmente com a
facilidade de gerao de relatrios do usurio final dos data marts
Publicao
#otificao de !ue os novos dados esto prontos
2omunicao de !uais!uer mudancas !ue tenham ocorrido nas
dimenses e novas 5assumptions6 !ue tenham sido inclu'das nos fatos
medidos e calculados
&tualiao
$nvolve:
2orreo de dados
&de!uao a mudanas em status" hierar!uias" corporate
o(nership
2onsulta
$nvolve
2onsultas ad hoc" escrita de relatrios" aplicaes de tomadas
de deciso" minerao de dados" etc.
<eedbac?@1ealimentao
Pode envolver a ingesto de dados limpos para os sistemas legados e
o resultado de processos@consultas comple,as para o data mart
&uditoria:
Processo de conhecer de onde os dados vieram e como foram
obtidos@calculados"etc .metadados de linhagem/
Aegurana
3ilema: a necessidade de publicar os dados da forma mais ampla
poss'vel e ao mesmo tempo proteger dados sens'veis contra hac?ers"
espies industriais" etc.
4ac?up e 1ecuperao de <alhas
$nvolve aspectos tais como onde e !uando tirar os 5snapshots6 de
dados legados e dos metadados para propsitos de ar!uivamento e
recuperao de desastres
Questionrio
Quais as diferenas entre o modelo dimensional e o relacional?
Os relacionais usam a normalizao para manter um banco integro, exigem uma serie
de restries dos quais so invariveis para o D!
Quais vantagens do modelo dimensional?
"implicidade, agilidade, sumarizao dos dados que so fundamentais para trabal#ar
com as ferramentas O$%&!
Quais as principais diferenas entre os modelos estrela e bloco de neve?
O modelo estrela esta desnormalizado e o floco de neve tem pouca normalizao!