Escolar Documentos
Profissional Documentos
Cultura Documentos
http://www.uniriotec.br/~tanaka/SAIN tanaka@uniriotec.br
Asterio K. Tanaka
A Data Warehouse is a subject-oriented, integrated, time-variant, non-volatile collection of data in support of managements decision-making process. W. !nmon"
Asterio K. Tanaka
&Ds 'peracionais
(ontes )*ternas
Data +arts
'/A4
Asterio K. Tanaka
Exploration Warehouse
$e%site
ODS DSS
The ODS serves to integrate legacy applications and to provide a basis for operational (tactical) DSS processing
$h% Op%rati nal Data St r% &ODS' i( a hy#rid (tru!tur% that ha( !hara!t%ri(ti!( " # th th% data war%h u(% and p%rati nal (y(t%m(. )%!au(% th% ODS i( a hy#rid (tru!tur%, it i( di""i!ult t #uild and p%rat%. $h% ODS all w( th% u(%r t ha*%: + O,$- r%(p n(% tim% &.// (%! nd(' + updat% !apa#iliti%( + DSS !apa#iliti%(
Asterio K. Tanaka
The Operational Data Store (ODS) i( a (u#0%!t1 ri%nt%d, int%2rat%d, !urr%nt, * latil% ! ll%!ti n " data u(%d t (upp rt th% tactical decision-making pr !%(( " r th% %nt%rpri(%. It i( th% !%ntral p int " data int%2rati n " r #u(in%(( mana2%m%nt, d%li*%rin2 a ! mm n *i%w " %nt%rpri(% data.
$h% %((%n!% " an ODS i( th% %na#l%m%nt " int%2rat%d, ! ll%!ti*% n1lin% pr !%((in2. 3n ODS d%li*%r( ! n(i(t%nt hi2h tran(a!ti n p%r" rman!%11tw t thr%% (%! nd(. 3n ODS (upp rt( n1lin% updat%. 3n ODS i( int%2rat%d a!r (( many appli!ati n(. 3n ODS pr *id%( a " undati n " r ! ll%!ti*%, up1t 1 th%1(%! nd *i%w( " th% %nt%rpri(%. 3nd, at th% (am% tim%, th% ODS (upp rt( d%!i(i n (upp rt pr !%((in2.
Asterio K. Tanaka
Se2undo Ki%ba11 DW 9 con:unto de Data +arts Inte2rados; co% (atos e Di%ens<es -on or%ados
We t!picall! re'er to the presentation area as a series o' integrated data marts( A data mart is a $edge o' the o)erall presentation area pie( In its most simplistic 'orm* a data mart presents the data 'rom a single %usiness process( +hese %usiness processes cross the %oundaries o' organi,ational 'unctions( We ha)e se)eral strong opinions a%out the presentation area( -irst o' all* $e insist that the data %e presented* stored* and accessed in dimensional schemas( -ortunatel!* the industr! has matured to the point $here $e.re no longer de%ating this mandate( +he industr! has concluded that dimensional modeling is the most )ia%le techni/ue 'or deli)ering data to data $arehouse users(
Asterio K. Tanaka
ODS
Finanas Produo
R.H. ...
Asterio K. Tanaka
$h% ri2inal ODS ar!hit%!tur% n%!%((itat%d tw pathway( and tw (y(t%m( #%!au(% th% main data war%h u(% wa(nCt pr%par%d t (t r% l w1l%*%l tran(a!ti n(. http://www.d#m(ma2.! m/971.dAD.html &D%!%m#%r 1997'
Asterio K. Tanaka
'DS 7 Ki%ba11
,%t u( r%d%"in% th% ODS a( " ll w(. $h% ODS i( a (u#0%!t1 ri%nt%d, int%2rat%d, "r%Eu%ntly au2m%nt%d (t r% " d%tail%d data in th% %nt%rpri(% data war%h u(%. $h% n%w ODS r%ality. $h% !l%anin2 and l adin2 pathway n%%d( nly t #% a (in2l% (y(t%m #%!au(% w% ar% n w pr%par%d t #uild ur data war%h u(% n th% " undati n " indi*idual tran(a!ti n(. http://www.d#m(ma2.! m/971.dAD.html &D%!%m#%r 1997'
Asterio K. Tanaka
sa1es inance
%arketin2
EDW
-ara Inm n, Data Mart( (@ d%pF(it ( (%!undGri ( d%ri*ad ( d Data 4ar%h u(%.
Asterio K. Tanaka
rtm012
Asterio K. Tanaka
-o%ponentes da Arquitetura
:ill Inmon
4 &amada de +rans'orma78o/Integra78o 4 Data $arehouse corporati)o 4 ODS corrente 4 Data Mart 4 Exploration DW 4 Metadado 4 4 4 4 4 4
"alph 6im%all
Data staging area &ole78o de DM.s 9 DW ODS histrico Data Mart 5 papel di'erente Dados ar/ui)ados Metadado
Asterio K. Tanaka
4 4
Asterio K. Tanaka
Dimensional Modeling is reasona%le )ia%le techni/ue 'or designing data marts* $hen t!pe o' access is )er! predicta%le Dimensional models are not suita%le 'or updating at all Di''ering %usiness areas $ill li3el! $ant a di''erent dimensional model to loo3 at similar data Series o' dimensional models are not 'lexi%le enough to support an enterprise.s entire Data Warehouse
4 4 4
Asterio K. Tanaka
1 H(ad para pr 0%t d% )D r%la!i nal 1 I rmaliJad %m $%r!%ira K rma I rmal 1 3d%Euad para apli!a?L%( p%ra!i nai( &O,$-'
Asterio K. Tanaka
4hat
5 w many 5 w mu!h
4hy
4h
5 w
Asterio K. Tanaka
1 H(ad para pr 0%t d% D4/DM 1 Em 2%ral d%(n rmaliJad 1 3d%Euad para apli!a?L%( analMti!a( &O,3-'
Asterio K. Tanaka
4 +ode1o Di%ensiona1
5 )strutura %ais 0ci1 e intuiti@a 5 Anterior ao ),; recriada por Ki%ba11 5 Tabe1as representa% (atos e Di%ens<es 5 Tabe1as (ato nor%a1i5adas; Tabe1as Di%ens"o pode% n"o ser nor%a1i5adas 5 Tabe1as Di%ens"o s"o pontos de entrada para acesso 5 Iun!<es s3 ocorre% entre Tabe1as (ato e Di%ens<es 5 /eitura e consu1ta %ais 0ceis para usu0rios n"o especia1i5ados
Asterio K. Tanaka
Asterio K. Tanaka
Aborda2ens de pro:eto de DW
4 In%on: Top Down 5 Data Warehouses &orporati)os
@ de grande a%rangncia @ complexos @ alta pro%a%i%lidade de insucesso
-on@er2Mncia de Aborda2ens
JWh6 notP.
5 4a6 strict attention to con or%in2 di%ensions and %easures across the business 5 A1so %ode1 hierarchies ear16 in piece 5 8a@e a per%anent sta2in2 area =Frd nor%a1 or%> and na%e it an ato%ic data warehouse 5 (eed di%ensiona1 data %arts ro% this DW/Sta2in2 area 5 &ui1d data %arts or depart%ents 2oin2 throu2h sta2in2 areaK
Asterio K. Tanaka
4 Trans or%a!"o
5 (unda%enta1 para c1are5a e inte2ra!"o 5 ,ecodi ica!"o de cate2orias: =%/ ; %a1e/ e%a1e to +/(> 5 A1tera!<es e uni or%i5a!"o de unidades de %edida; no%es de ca%pos; datasP
4 /i%pe5a
5 (unda%enta1 para qua1idade da in or%a!"o e*tra?da
4 -ar2a e ,ea1i%enta!"o
5 TradeOo =%uito requente $ caro; pouco si2ni ica dados J@e1hosK>
Asterio K. Tanaka
(erra%entas de )T/
D%*%1(% ! n(id%rar Nd%(%n* l*%r *%r(u( ! mprarO: ini!ialm%nt%, muita( %mpr%(a( %(!r%*%nd (%u( prFpri ( pr 2rama(P -r dut ( in!lu%m 2%rad r%( d% !Fdi2 u Ntran(" rmad r%( pr pri%tGri (OP Muita( "%rram%nta( (@ * ltada( para Gr%a( %(p%!M"i!a(, %m# ra ! m "un!i nalidad%( %m ! mumP 3 mai ria d ( pr dut ( Q r%lati*am%nt% imatura, %m# ra t%nham m%lh rad muit n ( Rltim ( an (P 3( "%rram%nta( (@ 2%ralm%nt% muit !ara(, %m# ra um n * m d%l d% pr%? ( %(t%0a (ur2ind P E(ta( "%rram%nta( (@ mai( ad%Euada( para am#i%nt%( ! mpl%S ( &mRltipla( " nt%( % d%(tin (, muita( tran(" rma?L%(, muita limp%Ja n%!%((Gria(', d%(d% Eu% a( tran(" rma?L%( n@ (%0am muit ! mpli!ada(.
Asterio K. Tanaka
4 J+etaO+etaOK
5 signi'ica =algo /ue descre)e algo /ue descre)e(((>
4 +etadados
5 =dados so%re os dados> 5 /uais/uer in'orma7Ees /ue permitam identi'icar* locali,ar* utili,ar e entender os dados 5 FMetadata is structured* encoded data that descri%e characteristics o' in'ormation;%earing entities to aid in the identi'ication* disco)er!* assessment* and management o' the descri%ed entities(F GAmerican i%rar! Association* +as3 -orce on Metadata Summar! "eport(* Hune 1IIIJ
Asterio K. Tanaka
Tal r d% a?L%(
C mpanhia 199D 1997 1997 199< UU VV W. .A 1A /A 1D .7 < ;A ./
...
Asterio K. Tanaka
#erMncia de +etadados
4 #rande desa io na constru!"o e %anuten!"o de u% DW
5 5 5 5 5 5 5 (or%atos de dados inconsistentes Dados ine*istentes ou in@01idos Di erentes n?@eis de a2re2a!"o InconsistMncias se%Nnticas Dua1idade de dados e :ane1a de te%po Acesso 21oba1 =distribu?do e rep1icado> Ad%inistra!"o e contro1e
Asterio K. Tanaka
+etadado de Ne23cio
5 tanto n"oOestruturado quanto estruturado 5 %ais di ?ci1 de ser tratado e inte2rado por u%a erra%enta a1ta%ente estruturada tipo u% reposit3rio
4 +etadados e% &I
5 +etadados para )T/ 7 )*tra!"o; Trans or%a!"o e -ar2a de siste%as '/T4 5 +etadados de '/A4: descri!<es de cubos; di%ens<es; %edidas; hierarquias; n?@eis 5 +etadados de erra%entas ront end: r3tu1os de te1as e re1at3rios 5 +etadados de Data +inin2: descri!<es de a12orit%os; consu1tas; resu1tados
Asterio K. Tanaka
I%portNncia de u% ,eposit3rio
5 ,eposit3rio @ 'erramentas /ue pro)em arma,enamento e 'uncionalidade de gerncia e acesso a metadados 5 Xis"o 21oba1 e inte2rada de %etadados 5 #erencia%ento do cic1o de @ida dos %etadados 5 Inte2ra!"o co% erra%entas de outros ornecedores
Asterio K. Tanaka
!" Diagram
- usto%er 'rder 4rod uct Sched u1ed De1i@er6 Sa1esp erso n
,orms
Spec
# siness $rocess
Kpdate Mar3eting Authori,e &redit Order Entr! :ill &ustomer Schedule Deli)er! In)entor!
Architect re
)** )ode
Asterio K. Tanaka
+eta%ode1os
4 ,eposit3rios s"o desen@o1@idos sobre +eta%ode1os; isto $; %etadados de %ode1os. 4 .% %ode1o de@e estar con or%e co% u% %eta%ode1o. 4 -a%adas de %eta%ode1os; se2undo o '+# ='b:ect +ana2e%ent #roup>:
5 +H: ob:eto instNncia; 1inha de tabe1a; re2istro =e*: JIo"o da Si1@a e seus dadosK> 5 +Q: %ode1o; esque%a =e*: c1asse .+/ ou tabe1a de banco de dados J-1ienteK> 5 +R: %eta%ode1o =e*: .ni ied +ode1in2 /an2ua2e O .+/; -o%%on Warehouse +eta%ode1 O -W+; Know1ed2e Disco@er6 +eta%ode1 7 KD+> 5 +F: %etaO%eta%ode1o =e*: +etaO'b:ect (aci1it6 O +'(>
Asterio K. Tanaka