Você está na página 1de 24

03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais

1/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
FundamentoseModelagemdeBancosde
DadosMultidimensionais
20de23pessoasclassificaramissocomotil Avalieestetpico
Publicadoem:4deoutubrode2007
PorAlexandreRicardoNardi
ArquitetodeSolues
MicrosoftBrasil
Contedo
Nestapgina
Introduo
FundamentosdeSistemasAnalticos
SistemasTransacionaisXSistemasAnalticos
DataWarehouseseDataMarts
BancosdeDadosMultidimensionais
ModelosdeDadosMultidimensionais
AlgunsConceitos
EstrelaesuasVariaes
SnowflakeesuasVariaes
Concluso
Referncias
Resumo:Esteartigoapresentaestruturasdeindexaoparabancosdedadosmultidimensionais,asrvoresBitmap,
comparandocomasestruturasusadasparabancosdedadosrelacionais.Entopercorremosdiversasopesparamodelagemde
dadosmultidimensionais,incluindoosModelosEstrelaeSnowflakeesuasvariaes.
Introduo
AutilizaodeSistemasGerenciadoresdeBancosdeDadosRelacionais(SGBDRs)prticaconsolidadamundialmente.Os
dadosprecisampoderserarmazenadoserecuperadosgeralmenteemintervaloscurtosdetempo,emsituaesnotriviaistais
como:
Situaesdealtaconcorrncia,porvezesdemilharesdeacessossimultneos,queprecisamsergerenciadosem
ambientestransacionais
Grandeswebsitesque,almdosrequisitosdedesempenho,necessitamcuidadosespecificamentecomrelao
seguranadosdados
Aplicaesanalticas,baseadasemhistricosdeanos,paraapoioadecisesgerenciaiseestratgicas.
AsestruturasdedadosemecanismosdeindexaoutilizadosporessesSGBDRsatendembemsduasprimeirassituaes.
Todavia,asaplicaesanalticaspossuempeculiaridadestaiscomomanipulaodegrandesvolumesdedadosebaixataxade
atualizao.Essascaractersticasfavorecemoutromodeloestrutural,maiseficienteeporvezesmaiseconmico,notocantea
espaodearmazenamento.
Conhecendoasestruturasdedados,acompreensodasalternativasdemodelagemdedadosmultidimensional,basedos
sistemasanalticos,ficafacilitada.
Nestetextoabordaremosasprincipaisdiferenasentresistemastransacionaiseanalticos,bemcomoalgumasestruturasde
indexaocomumenteutilizadasparacadatipo.Apresentaremos,ainda,consideraesimportantesquantomodelagemde
dadosmultidimensional,incluindoosmodelosestrelaesnowflakeesuasvariaes.
Iniciodapagina
FundamentosdeSistemasAnalticos
NosltimosanosotermoBusinessIntelligence(BI)temsidolargamenteutilizadonomercadocomosinnimodesistemas
analticos,OLAP,cubos,entreoutros.Emboraessasdenominaespossamestarassociadasentresi,soconceitualmente
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
2/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
distintas.
Arigor,BusinessIntelligencepodeserobtidoporqualquerartefato,sejatecnolgicoouno,quepermitaaextraode
conhecimentoapartirdeanlisesdonegcio.Porrazesbvias,aefetividadedestasanlisessermaiorseosdadosestiverem
disponveisdemodoconsistentee,preferencialmente,consolidado.EsteumdosobjetivosdosDataWarehouses.
SoluesinformatizadasdeBIgeralmentecontmsistemasanalticos,quepodemserdediversostipos,dependendodo
objetivodasanlisesedoperfildousurio,conformeilustradonaFigura1:
DecisionSupportSystems(DSS),ouSistemasdeApoioaDeciso:sobaseadosemrelatriosanalticos,normalmente
utilizadosporusuriosdenveloperacional
ManagementInformationSystems(MIS),ouSistemasdeInformaesGerenciais:permitemanlisesmaisprofundas,
comarealizaodesimulaesdecenrios.Porvezes,utilizamsedeferramentasdeDataMiningparaidentificaode
cruzamentosnotriviais.Soutilizadosporanalistasdenegciononvelttico
ExecutiveInformationSystems(EIS),ouSistemasdeInformaesExecutivas:sovoltadosparaprofissionaisque
atuamnonvelestratgicodasempresas,comodiretoresepresidncia.Oferecem,paratanto,umconjuntode
indicadoreschavededesempenho(KPI,ouKeyPerformanceIndicators).
Figura1:algunstiposdesistemasanalticos.
Oafinamentodapirmideindicaquantidadesmenoresemaisespecficasdeusuriosparacadasistema.
Independentementedotipodesistemaanaltico,estediferesubstancialmentedossistemastransacionaisdeproduo.A
seguir,apresentaremostaisdiferenas,bemcomoosconceitosenvolvidos.
Iniciodapagina
SistemasTransacionaisXSistemasAnalticos
Sistemastransacionais,tambmconhecidoscomosintticosouaindaOLTPOnlineTransactionalProcessingsoaqueles
que,comoonomesugere,baseiamseemtransaes.Algunsexemplosdestetipodesistemasso:
SistemasContbeis
AplicaesdeCadastro
SistemasdeCompra,Estoque,Inventrio
ERPs,CRMs.
Ossistemastransacionaissecaracterizampelaaltataxadeatualizao,grandevolumesdedadoseacessospontuais,ouseja,
pesquisascujoresultadosejadepequenovolume(atmilharesdelinhas,maspreferencialmentemenos).
Jossistemasanalticos,ouOLAPOnlineAnalyticalProcessingsecaracterizamporfornecersubsdioparatomadasde
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
3/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
deciso,apartirdeanlisesrealizadassobrebasesdedadoshistricas,porvezescommilhesderegistrosaseremtotalizados.
AlgunsexemplosdesistemasanalticossoosilustradosnaFigura1.
ATabela1sintetizaasprincipaisdiferenasentresistemastransacionaiseanalticos:
Tabela1:Comparaoentresistemastransacionaiseanalticos.
Caracterstica SistemasTransacionais(OLTP) SistemasAnalticos(OLAP)
Conformeilustradonatabelaacima,ofatodossistemastransacionaisrefletiremasituaoatualdeumdeterminadotipode
dadoconduztodasasdemaiscaractersticas,como:
Arealizaodeatualizaesfreqentemente,mantendoosdadosatuais
Informaodetalhadacomamaiorgranularidadepossvel(consistnciamicroscpica)
Pesquisaspontuais,portantodebaixacomplexidade,notocanteaonegcio(dopontodevistatcnico,apesquisapode
serbemelaborada).
Domesmomodo,ofatodasanlisesseremrealizadassobredadoshistricoslevasseguintescaractersticas:
Umavezqueosdadossohistricos,asatualizaesnoprecisamsertofreqentes.Porexemplo,numacomparao
entreaprodutividadedetrsfiliaisdeumaempresaparaumdeterminadoprodutonosltimosquatromeses,porms,o
diadehojeoumesmoontemno,emgeral,degranderepresentatividade
Asanlisesgeralmenteagrupaminformaes,sendotaisagrupamentosmaisimportantesnestecontextodoqueos
dadosdetalhados.Noexemplodoitemanterior,oimportanteaproduoconjuntamensal,enoaproduodeuma
unidadeparticulardoprodutoanalisado.
Osdiferentestiposdesistemastambmsugeremdiferentesabordagenstcnicas,sejanaformadearmazenamentooudebusca.
Nocasodossistemastransacionais,queexigemacessorpidoaosdados,principalmentenotocanteamodificaes,a
utilizaodendicesestruturadoscomorvoresbalanceadas,ouBTrees,adequada.Noentanto,essaestruturanoamais
recomendadaparasistemasanalticos,ondeasatualizaessoespordicas,masasconsultasenvolvemgrandesconjuntosde
dadosedevemsermuitorpidas.Outraestruturadedados,denominadarvorePATRICIA,maisadequadanestecontexto.As
prximasduasseesdescrevemofuncionamentodessasduasestruturas.
rvoresBalanceadas(BTrees)
Estetipodervore,empregadaporvriosSGBDRscomerciaisouno,possuiadenominaobalanceadapelofatodasfolhas
estarempraticamentemesmadistnciadaraiz,podendodiferiremapenasumnvel.AFigura2ilustraumarvore
balanceada:
Atualizaes Maisfreqentes Menosfreqentes
TipodeInformao Detalhes Agrupamento
QuantidadedeDados Poucos Muitos
Preciso Dadosatuais Dadoshistricos
Complexidade Baixa Alta
Consistncia Microscpica Global
Exemplos CRM,ERP,SupplyChain MIS,DSS,EIS
Terminologia LinhaseColunas Dimenses,MedidaseFatos
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
4/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Figura2:exemplodervorebalanceada.
Afiguraacimamostraumabuscanarvore,quepodeserrealizadademodoeficiente.Ofatodarvoreacimaserbinriamera
coincidncia.Valenotarqueumainseronestetipodervorepodeserrealizadacompequenaquantidadedeoperaes,
conformeilustradonaFigura3.Essasoperaesdenominamserotaes,evisamamanutenodarvorecomobalanceada.
Nosdoiscasos,ainserofoirealizadaemg,demodoadesbalanceararvore.Asrotaessugeridasreparamasituao.
Figura3:inseresemrvoresbalanceadas.
rvoresPATRICIA
ConcebidoporDonald.R.Morrison(1)edescritoem(2),PATRICIAumalgoritmopararealizaodebuscasemrvorescom
aschavesdosnsrepresentadasembinrio,semarmazenaraschavesnosns.OnomeumacrnimodePracticalAlgorithm
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
5/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
ToRetrieveInformationCodedInAlphanumeric,eomtodoparticularmentetilparatratamentodechavesdetamanho
varivelextremamentelongas,taiscomottulosefrases.Nocasodepesquisasanalticas,osdadospodemtirarproveitodeste
mtododesdequeasinformaessejamarmazenadascomocadeiasdetexto.
Umarestriodessasrvoresanecessidadedenohaverumelementoquesejaprefixodeoutro,oquepodefacilmenteser
obtidosenecessrio.
Emnossoexemplo,utilizaremosacodificaoapresentadanaTabela2paraasletrasdeAaZ:
Tabela2:representaobinriadasletrasdoalfabeto.
Caractere RepresentaoDecimal RepresentaoBinria
<espao> 0 00000
A 1 00001
B 2 00010
C 3 00011
D 4 00100
E 5 00101
F 6 00110
G 7 00111
H 8 01000
I 9 01001
J 10 01010
K 11 01011
L 12 01100
M 13 01101
N 14 01110
O 15 01111
P 16 10000
Q 17 10001
R 18 10010
S 19 10011
T 20 10100
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
6/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Ocaractere<espao>utilizadocomoseparadorentreaspalavras.
ATabela3ilustraarepresentaobinriadafraseESTEFOIUMESTUDODEARVOREPATRICIA:
Tabela3:representaoembinriodaspalavrasdoexemplo.
ApartirdafraseacimapossvelconstruirarvorePATRICIAilustradanaFigura4:
U 21 10101
V 22 10110
W 23 10111
X 24 11000
Y 25 11001
Z 26 11010
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
7/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Figura4:rvorePATRICIA.
Assetastracejadasindicamumancestraldoncorrente,eassetasCheiasindicamseusdescendentes.
Cadandarvorepossuiasseguintesinformaes:
KEY:umponteiroparaoinciodapalavranotextooriginal.Porexemplo,aoinvsdotexto(ESTUDO),on
deveriaconter13,queaposionafrasedoinciodapalavra
LLINKeRLINK:ponteirosrepresentandozeroeum,respectivamente.Maisdetalhesnoexemplodebuscanarvorea
seguir
LTAGeRTAG:camposbinriosindicandoseLLINKeRLINK,nestaordem,soponteirosparansancestrais(valor
um,representadopelassetastracejadasnaFigura4)oudescendentes(valorzero,correspondentessetascheiasna
Figura4).Porconveno,umnpodeserancestraldesimesmo
SKIP:onmerodebitsquepodemserpuladosduranteumabusca.Oexemplodebuscaaseguirilustraesseconceito.
AraizdarvorecontmapenasKEY,LLINKeLTAG.
BuscaemrvoresPATRICIA
Oalgoritmodebuscarelativamentesimples.Ilustraremosaquidoiscasos:
1. Buscaporumelementopresentenarvore:procurapelapalavraFOI(embinrio,001100111101001)
Abuscainicianonesquerdadaraiz,(UM).OcampoSKIPpedeparaanalisarmosobit1.Sevaler0,
procuraesquerda.Sevaler1,procuradireita.Noexemplo,seguimosparaaesquerda
Estandonon(ARVORE),ocampoSKIP=2somadoaosSKIPsanteriores,ou1+2,pedeparaanalisarobit
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
8/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
3dotextosendoprocurado.Comovale1,procuradireita
Estandonon(FOI),ocampoSKIPpedeparaanalisarobit4.Comovale1,seguedireita
Comooncorrentenomudou,testaovalordachaveparasaberseencontrou.Essetesteimportante,umavez
queopadro0x11xxxxxxxxxxxfoiencontrado.UmabuscapelotextoFUItambmterminarianomesmo
padro.
2. Buscaportodososelementosquecomeamcomumacadeia.Porexemplo,buscaportodososelementosquecomecem
porEST(embinrio,001011001110100):
Abuscaprocededamesmaformaqueaanterior,atomomentoemquetentasecompararbitinexistente(16
bit)notextoprocurado(15bits)
Nesseponto,comparaseotextoprocuradocomoelementocorrente(ESTUDO).Seencontrou,entoo
mesmopadrotambmestpresentenosdescendenteseancestraisdesten,devendoserentocomparados.
ConstruodervoresPATRICIA
Estealgoritmofuncionadaseguinteforma:
1. Araizdarvorecontmaprimeirapalavralida,conformeaFigura5
2. Apartirda,paracadanovoelemento,fazemosduasbuscas:
Aprimeiraparaprocuraraprovvellocalizaodoelemento.Considerandotodososelementosdistintos,essa
buscasempresermalsucedida
Naposioencontradanaprimeirabusca,determinasequantosbitscoincidemcomoelementonovo
Da,fazsenovabuscaparaencontrarprecisamenteaposioainserironovoelemento.
AseqnciadefigurasaseguirilustraaconstruodarvoredaFigura4:
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
9/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Figura5:seqnciadefigurasilustrandoaconstruodeumarvorePATRICIA.
ArvorecompletaestnaFigura4.
Emborasejaumaestruturadedadosmuitoeficientenoquedizrespeitoabuscas,executandoemtemposO(lgN),ondeNo
nmerodeelementosdarvore,ocustodeatualizaesgrande,inviabilizandoseuusoparaaplicaestransacionais.
Iniciodapagina
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
10/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Data Warehouses e Data Marts
Essesdoisconceitoscomumenteseassociamaousodeaplicaesanalticas.
UmDataWarehouseumabasededados,geralmenterelacional,queconsolidaasinformaesempresariais.Suaconstruo
(3)umprocessonormalmentemorosoecomplexo,pordiversosfatores,dentreosquaisagrandequantidadededados,
diversasfontesdeinformaescombasesheterogneasemuitasvezesinconsistentes,envolvimentodevriasreasou
departamentosdaempresa.UmdosmaioresdesafiosnaconstruodoDWaextraoeconsolidaodosdados
operacionais,pois:
Podehavervriasfontes
Osdadosprecisamserlimpos
Agranularidadeprecisaserajustada
Podesernecessrioresumirdados
DevehavervaloresdefaultetratamentodeNULL
necessriocomponentetemporal
Osrelacionamentosnosdadosdeentradaprecisamserclaros.
Algumassituaescomunsentreasfontesdedados:
Mesmosdados,nomesdiferentes
Dadosdiferentes,mesmonome
Dadosexclusivosdeumaaplicao
Chavesdiferentes,mesmosdados.
Comomtodosdeconstruo,existemformalmentedois:
Topdown,noqualrealizadaamodelagemintegraldoDW,seguidapelasextraesdedados.Aprincipalvantagem
acriaodeummodelonico.Orevsficaporcontadomaiortempodeprojeto
Bottomup,ondeofocoemumareaporvez,comocrescimentogradualdoDW.Avantagemaobtenode
resultadosaintervalosmaiscurtos,garantindomuitasvezessustentaoaoprojeto.Adesvantagemamaior
dificuldadedeseconsolidarinformaesentreasdiversasreas.
Umaalternativasestratgiasacima,denominadaMiddleout,aproveitarasvantagensdecadaumapormeiodo
desenvolvimentoiterativodoDW:
1. Omodelodedadoscorporativooprimeiroaserdesenvolvidoeoresponsvelpelaintegraodosdemais
2. Asprimeirastabelasdareadeinteresseescolhidasopovoadas:primeirasanlises
3. Povoamentodemaistabelascomdadoshistricos
4. AlgunsdadospassamacomporoDW,saindodabaseoperacional
5. Surgimentodosdatamarts(aseguirnestaseo)
6. OcicloserepeteatqueoDWestejacompleto.Basesdeproduocontmapenasdadosoperacionais.
OutrofatorcrticoparaosucessodeumDWogerenciamentodovolume.EmboraoconceitodeDWseapliqueagrandes
quantidadesdedados,chegandoatualmenteaordemdeTB,suacapacidadenoinfinita,devendoserutilizadasabiamente.
ApenasdadosrelevantesdeveriamconstardoDW.Podeserqueohorriodeumadeterminadatransaosejaimportante
quandoofocoforocurtoprazo,masqueapenasumcontextodeagrupamentosejasuficienteparadadosdecincoanosatrs.
QuestescomoessadevemserconsideradasduranteoplanejamentodoDW,poisajudamadimensionlo.
AremoodedadosdoDWumassuntotratadocomreceiopelosDBAsepelosanalistasdenegcio.Arigor,toimportante
quantosaberquedadosarmazenar,saberquandoequaisdadosremoverdoDW.Algumasestratgiasso:
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
11/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
esumirdadosmaisantigos
Armazenarosdadosantigosemmeiomaisbarato(fita)
RemoverosdadosdoDW.
Taisestratgiasnosoexcludentes,podendoserutilizadasemconjunto.
AimportnciadaremoodedadosestemmanteroDWomaisenxutopossvel,emboraissopossaparecercontraditrioao
conceitodeDW.
Comrelaogranularidade,asbasesdedadosoperacionaistrabalhamcomomaiornveldedetalhepossvel,ouseja,amaior
granularidade.JnoDWpodehaverdiversosgrausdeagregaoeresumodosdados.Porexemplo,osdadosdoanocorrente
podemserdetalhadosporitemdepedidos,deumacincoanos,portotaldecadapedidoe,apsisso,portotaldepedidospor
dia.AcorretadeterminaodagranularidadeexercepapelfundamentalnoplanejamentodecapacidadeedesempenhodoDW.
Aocontrriodoqueocorrecomasbasesoperacionais,oDW,porconterdadoshistricos,nodemandaaltataxade
atualizao.Dessemodo,podeseratualizadoacada24horasouatmesmoumavezporsemana.Almdisso,porsofrerpoucas
modificaes,edeformacontrolada(poraplicaesespecficasparaessefim),seusrelacionamentospodemserimplementados
atravsdeentidades,emboraissonosejafreqente.
Emboraconsolideasinformaesdaempresa,mesmoquedemodoiterativo,osDWssogeralmentearmazenadosembancos
dedadosrelacionais,enoseutilizamdeestruturastaiscomoasrvoresPATRICIA.NestepontosurgemosDataMarts(DM),
bancosdedadosmultidimensionaisespecficosporreadenegciopararealizaodeanlises.AlgunsconceitossobreData
Martsnoestomuitobemclarosparaomercado.OprocessodeconstruodeumDWedeDMs,ilustradonaFigura6,ajuda
aesclareceralgunsdeles:
Figura6:etapasdaconstruodeumDWedeDMs.
Comopodesernotadonafiguraacima,umDWconstrudoiterativamentepossuiporesagrupadasporsegmentodenegcio,
regioouqualqueroutraformaquesejaadequadaempresa.EssasporesalimentamosDataMarts,quepodemserento
consultadosporferramentasdeanlise.
Iniciodapagina
BancodeDadoMlidimenionai
Afinalidadedebasesdedadosmultidimensionais(algunsautoreschamamdedimensionais)fornecersubsdiopara
realizaodeanlises.Paratanto,suaarquiteturaeatmesmoaterminologiaempregadasodistintasdasutilizadaspara
bancosdedadostransacionais.
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
12/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Ofatodeexistiremdiversasinformaesaseremcruzadas(dimenses)permitearealizaodepesquisastaiscomoailustrada
naFigura7:
Figura7:eemplodepesquisamultidimensional.
Terminologia
Asanlisessobredadoshistricosenvolvemumasriedepossibilidadesdecruzamentoseagrupamentosdeinformaes,com
ousodosseguintestermos:
Dimenses:estabelecemaorganizaodosdados,determinandopossveisconsultas/cruzamentos.Porexemplo:
regio,tempo,canaldevenda,...Cadadimensopodeaindaterseuselementos,chamadosmembros,organizadosem
diferentesnveishierrquicos.Adimensotempo,porexemplo,podepossuirduashierarquias:calendriogregoriano
(comosnveisano,msedia)ecalendriofiscal(comosnveisano,semanaedia)
Medidas:soosvaloresaseremanalisados,comomdias,totaisequantidades
Fatos:soosdadosaseremagrupados,contendoosvaloresdecadamedidaparacadacombinaodasdimenses
existentes.Otamanhodatabelaquecontmosfatosmereceatenoespecialdoanalista
Agregaes:totalizaescalculadasnosdiversosnveishierrquicos.
AcriaodeDMsimplicanageraodeagregaes.Esteprocessamentoserefleteemganhodedesempenhoquandoda
realizaodeconsultas.
AlicerceRelacional
Diversasferramentasanalticas,tambmchamadasferramentasdeOLAP,operamsobrebasesdedadosmultidimensionais
armazenadasemSGBDRs.Almdisso,asagregaessotambmmantidasembancodedadosrelacional.
EstaformadearmazenamentoconhecidacomoROLAP,ouRelationalOLAP.Umavezqueosdadosjseencontramemum
modeloapropriado,chamadomultidimensional(vejaopesdemodelagemnasprximassees),bastaprocessaras
agregaes.Comissoobtmseganhodeespaodearmazenamento,umavezqueosdadospermanecemapenasnabasede
origem(multidimensional),emboraacriaodegrandesquantidadesdeagregaespossaincorreremexplosodedados.
AlicerceemCubos
Outraformadearmazenamento,cujomodelomatemticodenominasehipercubos,apresentaacaractersticadepossuir
armazenamentoeindexaoemestruturasdedadosqueotimizamconsultasaoinvsdeatualizaes,comoocasodas
rvoresPATRICIA.
EstaformaerroneamentechamadaMOLAP,ouMultidimensionalOLAP.OerroestnofatodequebasesROLAPtambm
somultidimensionais.
Quandoomodelomultidimensionalprocessado,novabasegerada,destavezcontendotantoosdadosquantoas
agregaesemformatoprprio,utilizandosedeestruturasapropriadasparapesquisas.
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
13/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
AFigura8ilustraumarepresentaodeumcubocomtrsdimenses:
Figura8:representaodeumcubocomasdimensesProduto,RegioeTempo.
Emboraoriscodeexplosodedadossejacomumemestruturasrelacionaisporcontadecruzamentossemdados,masque
ocupamalgumespao,asestruturasutilizadaspeloscubossoesparsas,eseaplicamadadoseagregaes,demodoqueos
cubossosubstancialmentemenoresdoqueabasemultidimensionalqueooriginou.
Iniciodapagina
ModelodeDadoMlidimenionai
Anaturezadousodebancosdedadosmultidimensionaistornasuamodelagemdistintadaquelautilizadaparasistemas
transacionais.Nesteltimoaplicamostcnicasdenormalizaoseguidasporgrausdedesnormalizaoafimdeobtero
desempenhodesejadoaoreduzironmerodetabelasemjunes(joins).
Valelembrarqueonmerodeplanosdeexecuoparaumajunodentabelasn!,isto,paraumajunode10tabelash
3.628.800possibilidades.EmboraoescalonadordoSGBDpossuaestratgiasparareduzirestenmero,umpontodeateno
aconsiderar.JparaocasodosMDDBs,ograudedesnormalizaobemmaior,dadoovolumededadoseaagilidadena
consolidaodevaloresquandocalculandoasagregaes.
Nestaseo,comtrechosextradosde(4)e(5),percorremosalgunsconceitosimportantesparaamodelagemquanto
representaodefatos,dimensesequantoachaves.Entodescrevemosvriosmodelosdedados,sempredopontodevista
lgico.Portanto,osmodelosqueveremosserosemprerelacionais,independentementedoalicerce,relacionalouemcubos,
quepodeserutilizadoparaomodelofsico.
Iniciodapagina
AlgnConceio
Quandoomodelodedadoscomeaaserdefinido,elementosbsicosderepresentaoprecisamtersidoestabelecidos,de
modoacriarseumpadrodemodelagem.Emnossomodeloteremosasdimensesefatosrepresentadosemtabelas,podendo
havermltiplasdimensesemltiplastabelasdefatos.
Fatos
Aomodelara(s)tabela(s)defatos(ouapenastabelafato),deveseteremmenteosseguintespontos:
Achaveprimriacomposta,sendoumelementodachaveparacadadimenso
Cadaelementochaveparaadimensodeveserrepresentadoedescritonatabeladimensocorrespondente(para
efetuarajuno)
Adimensotemposemprerepresentadacomopartedachaveprimria.
Dimenses
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
14/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Devehaverumatabeladimensoparacadadimensodomodelo,contendo:
Umachaveartificial(ougerada)genrica
Umacolunadedescriogenricaparaadimenso
Colunasquepermitamefetuarosfiltros
UmindicadorNVELqueindicaonveldahierarquiaaquesereferealinhadatabela.
AFigura9ilustraumatabelaparaadimensoGeografia,comospontosacimarepresentados.Notequeacolunanvel
determinaahierarquia(Regio/Estado/Cidade
Figura9:exemplodeumatabeladedimenso
Valoresnulosiroexistiremalgumascolunas,dependendodonvelhierrquicoparaoqualalinhacontenhavalores.Esseo
casodacolunaloja:comosomenteexistemlojasnascidades,enonosestadosouregies,atabelaficacomnulos,
conformeidentificadospelaregiocircundadanafigura.Todavia,tarefadomodelofsicoreduziroespaoocupadopelos
nulos
ADimensoTempo
Estaumadimensoquepraticamentetodosossistemasanalticospossuem,dadaacaractersticaderealizaodeanlisesem
dadoshistricos.Deveriaconter:
Umacolunachaveparaajunocoma(s)tabela(s)defato(s)
Umadescriogenricaparacadaperodo
Colunasquepermitamefetuarosfiltros
Colunasinalizadoradapresenadefatosparaoperododetempoindicadonalinha
ColunaRESOLUOusadapararestringiroperodoaonvelapropriadooperadeformaidnticacolunaNVEL
dasoutrasdimenses
ColunaSEQNCIAquecontmumnmeroseqencialde1anemcadanveldoperododetempoeidentificaa
ordemrelativadecadadata.Permite:
ColunaSEQNCIAquecontmumnmeroseqencialde1anemcadanveldoperododetempoe
identificaaordemrelativadecadadata.Permite:
Construescomclculosdetempo,comoltimosquatrodias,porexemplo.
AFigura10mostraumexemplodetabeladedimensotempo.Notequeadescriooqueaparecerparaosvaloresdeuma
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
15/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
determinadadataouperodo.
Figura10:exemplodeumatabelaparaadimensotempo
ConsideraessobreChaves
Notocanteschaves,sistemasanalticosdevemcontarcomchavesartificiais,porumasriedemotivos:
Qualqueratualizaodedadosficasimplificada.Porexemplo,umrecadastramentodeCPFs,emboraimprovvel,
poderiaresultarematualizaodegrandevolumeparaumatabeladefatosdetransaesbancrias,casooclientefosse
identificadocomCPFsendochave
Comumanicacolunaparaachave,geralmentedetipointeiro,odesempenhodepesquisastendeasermelhor
quantomenorotamanhodachave,melhorodesempenho
Ofatodeserchavesimplesfacilitaaexecuodejunes.
Iniciodapagina
EstrelaesuasVariaes
UmadasformasdeapresentaodeumbancodedadosmultidimensionalatravsdoModeloEstrela,apresentadoporRalph
Kimball(4).Nocentrodaestrelaencontraseatabeladefatose,aoseuredor,asdimenses.Estemodeloapresentadona
Figura11:
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
16/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Figa11:ModeloEela
ummodelosimpleseeficiente,caracterizadoporpossuirumanicatabeladefatosechavessimplesnastabelasde
dimenses.Cadadimensorepresentadaporumanicatabela.
Ospontospositivosdestemodelosoaeficincia,dadapeloreduzidonmerodejunesnaspesquisasepelaschaves
simples,eafacilidadededefinirhierarquias.
Ospontosnegativossootamanhoeadesnormalizaodastabelasdedimenses.
ModeloEelaPacial
umavariaodoModeloEstrela,naqualexistemvriastabelasfatoededimensoseparadaslgicaefisicamentepornveis
desumarizao.
Dessemodo,osdadossoparticionadosemgranularidadesdistintas.Porhavervriastabelasfato,naprticaexistemvrias
estrelas,cadaumarepresentandoumacombinaodenveisdeagregaoemcadadimenso.AFigura12apresentaumaparte
domodeloqueilustraestavariao.
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
17/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Figura12:eemplodeduasestrelasnoModeloEstrelaParcial
Quandohouvernecessidadedenovasagregaes,bastacriaroutrastabelascomasgranularidadesdesejadas,comoilustrado
naFigura13.
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
18/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Figura13:ModeloEstrelaParcialparacomposiesdeagregaes
Ospontospositivosdestemodelosoamaioreconomiadeespao,eliminandoredundnciasecolunasquenotmsentido
paradeterminadonveldeagregaoeomelhordesempenhoparaconsultasdenvelespecficodeagregao.
Poroutrolado,acomplexidadedomodelomaioreasconsultasquecombinamnveisdeagregaodistintossomais
elaboradas,podendoresultaremquedadedesempenho.
ModeloEstrelacomParticionamentodeFatos(ouModeloConstelaodeFatos)
umavariaodoModeloEstrelaParcial,naqualosfatossoparticionadoseasdimensescompartilhadas,conforme
ilustradonaFigura14.
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
19/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Figura14:ModeloParticionamentodeFatos
QuandocomparadoaoModeloEstrelaParcial,estemodelomenosexigentequantosuamanuteno,dadoo
compartilhamentodastabelasdedimenso.
ModeloEstrelacomParticionamentodeDimenses
Assimcomooanterior,umavariaodoModeloEstrelaParcial,pormcomasdimensesparticionadas,compartilhandoa
tabeladefatos.AFigura15apresentaestemodelo.Notequeatabeladefatosdeveconterosseusdadosnamaior
granularidadequeomodelopreviretambmconsolidadosdeacordocomosnveismaisaltos.
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
20/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Figura15:ModeloParticionamentodeDImenses,paralocaletempo.Noteagranularidadedatabeladefatos.
Estemodeloparticularmentetilquandohouverdimensescomgrandequantidadedeelementos,comoocasodeSKUsde
produtos,porexemplo.
Iniciodapagina
SnowflakeesuasVariaes
OsModelosSnowflakeacrescentamgrausdenormalizaostabelasdedimensesdoModeloEstrela,eliminando
redundnciaseanecessidadedoindicadorNVEL.AFigura16mostraoresultadodanormalizaodastabelasProdutose
LojasapresentadasnaFigura11.Observeareduonasredundncias,oqueresultaemagilidadenamanuteno.Apesar
disso,ummodeloqueresultaemmaiornmerodetabelasemjunes,podendohaverquedadedesempenho.
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
21/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Figura16:ModeloSnowflake,apsnormalizaodoModeloEstreladaFigura11
AseguirveremostrsvariaesdoModeloSnowflake.
ModeloSnowflakeLookup
Nestemodelo,ilustradonaFigura17,astabelasdedimensessonormalizadas,resultandonaeliminaoderedundncias,o
quetornaamanutenomaisgileomodelomaisconsistente.
Aqui,criamosumatabelaprincipalparaumadeterminadadimenso,quereferenciatabelasdebusca(lookup),estascontendo
osnomesedescriesdecampos.
Umcuidadoextracomestemodeloonmerodetabelasemjunes,oquepodedegradarodesempenho.
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
22/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Figura17:partedoModeloSnowflakeLookup,mostrandoanormalizaodatabelaClientesdomodelodaFigura16
Observenodiagramaacima,queatabeladefatosfoideslocadaparaaesquerdaenemtodasasdimensesestorepresentadas,
afimdemelhoraravisualizaodomodelo.NotequeatabeladedimensoPrincipalClientespossuiapenasosdadosde
cadaclienteechavesestrangeirasparaoutroselementos,sendoqueamanutenodestesfeitademodomaisconsistenteao
promoveralteraesapenasnastabelasdebusca(lookup).
ModeloSnowflakeChain
Estemodeloencadeiaastabelasdedimensescomeandocomatabelaprincipal,queopontodeentradaparaatabelafato.
Atabelaprincipaldadimensocontmachaveparaoprximonveldahierarquiadadimensoeassimpordiante.NaFigura
16,anormalizaodadimensoProdutosemdiversosnveisumexemplodestemodelo.Notequeatabeladefatospossui
indicaodonvelmaisbaixonahierarquia,referenciandoadimensoProdutos,eentoastabelasdedimensesModelos
eFabricantespercorremosnveismaisaltos.
Arecomendaodeusodestemodeloocorrequandoonveldedetalhemaisbaixoestarmazenadonatabeladefatos.A
contraindicao,porsuavez,paraoscasosemqueapesquisarequervriosnveisdesumarizaodainformao,jqueso
necessriosvriospassospararecuperarasinformaes.Afimdemelhorarodesempenho,umasugestodesnormalizara
cadeia,inserindoaschavesdenveismaisaltosnosnveismaisbaixos.
ModeloSnowflakeAttribute
Comoobjetivodereduzironmerodeinformaesreferentesaatributosnastabelasdefatos,geralmenteutilizadospara
obtenodedetalhes(drillthrough),inserimostodoselesemumatabeladeatributos,conformeilustradopelasfigurasaseguir.
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
23/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
Figura18:ModeloSnoflake,antesdesepararosatributos
Figura19:ModeloSnoflakeAttribute
Outrautilidadedestemodeloaconsolidaodeinformaessobrediversaspequenasdimensesquepossuampoucos
campos(muitasvezesapenasadescrio)emumanicatabela.Dessemodo,onmerodetabelasemjunespodeser
reduzido,melhorandoodesempenho.
Iniciodapagina
Concluso
03/02/12 Fundamentos e Modelagem de Bancos de Dados Multidimensionais
24/24 msdn.microsoft.com/pt-br/librar/cc518031.asp
2012Microsoft.Todososdireitosreservados.
Odesenvolvimentodesistemasanalticoscadavezmaiscomum.Emborahajaferramentasdediversosfornecedores,denada
elasadiantamseamodelagemdedadoseoparadigmaanalticonoforemcompreendidos.
Nesteartigoprocuramospercorrerassuntospoucodivulgadosecompoucabibliografia.Abordamosasestruturasdedados
maiscomumenteencontradasemgerenciadoresrelacionaiseanalticos:asBTreeseasrvoresBitmap.Aoconhecerum
poucodaestruturaquesuportaastecnologias,esperamosqueoleitorpossaescolhermelhoreentenderascaractersticasde
cadamodelodedadosquedesenvolveresuportar.
Asopesdemodelagemsovriaseaquiilustramosalgumasquepodemserutilizadasdemodoisoladoouainda
combinadas,afimdeproduzirmodelosdedadosmultidimensionaisqueatendamasuademanda.
Iniciodapagina
Referncias
1. PATRICIAPracticalAlgorithmToRetrieveInformationCodedInAlphanumeric.Morrison,DonaldR.4,1968,
JACM,Vol.15,pp.514534.
2. Knuth,DonaldE.TheArtofComputerProgramming.s.l.:AddisonWesley,1998.Vol.3.ISBN0201896850.
3. Inmon,WH.BuildingtheDataWarehouse.s.l.:JohnWiley&Sons,1998.
4. Ferreira,JooEduardo,Italiano,IsabelCristinaandTakai,OsvaldoKotaro.IntroduoaBancodeDados.
[Online]2005.[Cited:0621,2007.]http://www.ime.usp.br/~jef/apostila.pdf.
5. Tanler,Richard.TheIntranetDataWarehouse.s.l.:JohnWiley&Sons,1997.
6. Kimball,Ralph.TheDataWarehouseToolkit.s.l.:JohnWiley&Sons,2000.
Iniciodapagina
Issofoitilparavoc? Sim No

Você também pode gostar