Você está na página 1de 9

UNIVERS IDAD METROPOLITANA DEL ECUADOR

CONS ULTA:
Caractersticas bsicas de datawarehouse Diferencia entre bases de datos operacionales y datewarhauos

NOMBRE:
Gabriel Augusto Guanoluisa Cndor

MATERIA:
Datawarehouse

Grupo:
DW.GR1

CARACTERSTICAS BSICAS DE DATA WAREHOUSE


ntre las principales se tiene!
o o o o

"rientado al te#a $ntegrado De tie#po %ariante &o %oltil

Orient !o

Te" #

'a infor#acin se clasifica en base a los aspectos (ue son de inter)s para la e#presa. *iendo as+ los datos to#ados estn en contraste con los clsicos procesos orientados a las aplicaciones. n la ,igura &- 1 se #uestra el contraste entre los dos tipos de orientaciones. l a#biente operacional se dise.a alrededor de las aplicaciones y funciones tales co#o pr)sta#os+ ahorros+ tar/eta bancaria y depsitos para una institucin financiera. 0or e/e#plo+ una aplicacin de ingreso de rdenes puede acceder a los datos sobre clientes+ productos y cuentas. 'a base de datos co#bina estos ele#entos en una estructura (ue aco#oda las necesidades de la aplicacin. n el a#biente data warehousing se organi1a alrededor de su/etos tales co#o cliente+ %endedor+ producto y acti%idad. 0or e/e#plo+ para un fabricante+ )stos pueden ser clientes+ productos+ pro%eedores y %endedores. 0ara una uni%ersidad pueden ser estudiantes+ clases y profesores. 0ara un hospital pueden ser pacientes+ personal #)dico+ #edica#entos+ etc. 'a alineacin alrededor de las reas de los te#as afecta el dise.o y la i#ple#entacin de los datos encontrados en el data warehouse. 'as principales reas de los te#as influyen en la parte #s i#portante de la estructura cla%e.

'as aplicaciones estn relacionadas con el dise.o de la base de datos y del proceso. n data warehousing se enfoca el #odela#iento de datos y el dise.o de la base de datos. l dise.o del proceso 2en su for#a clsica3 no es separado de este a#biente. 'as diferencias entre la orientacin de procesos y funciones de las aplicaciones y la orientacin a te#as+ radican en el contenido de la data a escala detallada. n el data warehouse se e4cluye la infor#acin (ue no ser usada por el proceso de siste#as de soporte de decisiones+ #ientras (ue la infor#acin de las orientadas a las aplicaciones+ contiene datos para satisfacer de in#ediato los re(ueri#ientos funcionales y de proceso+ (ue pueden ser usados o no por el analista de soporte de decisiones. "tra diferencia i#portante est en la interrelacin de la infor#acin. 'os datos operacionales #antienen una relacin continua entre dos o #s tablas basadas en una regla co#ercial (ue est %igente. 'as del data warehouse #iden un espectro de tie#po y las relaciones encontradas en el data warehouse son #uchas. 5uchas de las reglas co#erciales 2y sus correspondientes relaciones de datos3 se representan en el data warehouse+ entre dos o #s tablas.

Inte$r %i&n
'a integracin de datos se #uestra de #uchas #aneras! en con%enciones de no#bres consistentes+ en la #edida unifor#e de %ariables+ en la codificacin de estructuras consistentes+ en atributos fsicos de los datos consistentes+ fuentes #6ltiples y otros. l contraste de la integracin encontrada en el data warehouse con la carencia de integracin del a#biente de aplicaciones+ se #uestran en la ,igura &- 7+ con diferencias bien #arcadas.

A tra%)s de los a.os+ los dise.adores de las diferentes aplicaciones han to#ado sus propias decisiones sobre c#o se debera construir una aplicacin. 'os estilos y dise.os personali1ados se #uestran de #uchas #aneras. *e diferencian en la codificacin+ en las estructuras cla%es+ en sus caractersticas fsicas+ en las con%enciones de no#bra#iento y otros. 'a capacidad colecti%a de #uchos de los dise.adores de aplicaciones+ para crear aplicaciones inconsistentes+ es fabulosa. 'a ,igura &- 7 #encionada+ #uestra algunas de las diferencias #s i#portantes en las for#as en (ue se dise.an las aplicaciones. Co!i'i% %i&n. 'os dise.adores de aplicaciones codifican el ca#po G & R" en %arias for#as. 8n dise.ador representa G & R" co#o una 959 y una 9,9+ otros co#o un 919 y un 9:9+ otros co#o una 9;9 y una 9<9 e inclusi%e+ co#o 9#asculino9 y 9fe#enino9. &o i#porta #ucho c#o el G & R" llega al data warehouse. 0robable#ente 959 y 9,9 sean tan buenas co#o cual(uier otra representacin. 'o i#portante es (ue sea de cual(uier fuente de donde %enga+ el G & R" debe llegar al data warehouse en un estado integrado unifor#e. 0or lo tanto+ cuando el G & R" se carga en el data warehouse desde una aplicacin+ donde ha sido representado en for#ato 959 y 9,9+ los datos deben con%ertirse al for#ato del data warehouse. Me!i! !e tri(uto#. 'os dise.adores de aplicaciones #iden las unidades de #edida de las tuberas en una %ariedad de for#as. 8n dise.ador al#acena los datos de tuberas en cent#etros+ otros en pulgadas+ otros en #illones de pies c6bicos por segundo y otros en yardas. Al dar #edidas a los atributos+ la transfor#acin traduce las di%ersas unidades de #edida usadas en las diferentes bases de datos para transfor#arlas en una #edida estndar co#6n. Cual(uiera (ue sea la fuente+ cuando la infor#acin de la tubera llegue al data warehouse necesitar ser #edida de la #is#a #anera. Con)en%ione# !e No"(r "iento. l #is#o ele#ento es frecuente#ente referido por no#bres diferentes en las di%ersas aplicaciones. l proceso de transfor#acin asegura (ue se use preferente#ente el no#bre de usuario. *uente# M+,tip,e#. l #is#o ele#ento puede deri%arse desde fuentes #6ltiples. n este caso+ el proceso de transfor#acin debe asegurar (ue la fuente apropiada sea usada+ docu#entada y #o%ida al depsito. =al co#o se #uestra en la figura+ los puntos de integracin afectan casi todos los aspectos de dise.o > las caractersticas fsicas de los datos+ la disyunti%a de tener #s de una de fuente de datos+ el proble#a de estndares de deno#inacin inconsistentes+ for#atos de fecha inconsistentes y otros.

Cual(uiera (ue sea la for#a del dise.o+ el resultado es el #is#o > la infor#acin necesita ser al#acenada en el data warehouse en un #odelo global#ente aceptable y singular+ aun cuando los siste#as operacionales subyacentes al#acenen los datos de #anera diferente. Cuando el analista de siste#a de soporte de decisiones obser%e el data warehouse+ su enfo(ue deber estar en el uso de los datos (ue se encuentre en el depsito+ antes (ue preguntarse sobre la confiabilidad o consistencia de los datos.

De Tie"po V ri nte
=oda la infor#acin del data warehouse es re(uerida en alg6n #o#ento. sta caracterstica bsica de los datos en un depsito+ es #uy diferente de la infor#acin encontrada en el a#biente operacional. n )stos+ la infor#acin se re(uiere al #o#ento de acceder. n otras palabras+ en el a#biente operacional+ cuando usted accede a una unidad de infor#acin+ usted espera (ue los %alores re(ueridos se obtengan a partir del #o#ento de acceso. Co#o la infor#acin en el data warehouse es solicitada en cual(uier #o#ento 2es decir+ no 9ahora #is#o93+ los datos encontrados en el depsito se lla#an de 9tie#po %ariante9. 'os datos histricos son de poco uso en el procesa#iento operacional. 'a infor#acin del depsito por el contraste+ debe incluir los datos histricos para usarse en la identificacin y e%aluacin de tendencias. 2?er ,igura &- @3.

l tie#po %ariante se #uestra de %arias #aneras! 1. 'a #s si#ple es (ue la infor#acin representa los datos sobre un hori1onte largo de tie#po > desde cinco a die1 a.os. l hori1onte de tie#po representado para el a#biente operacional es #ucho #s corto > desde %alores actuales hasta sesenta a no%enta das. 'as aplicaciones (ue tienen un buen rendi#iento y estn disponibles para el procesa#iento de transacciones+ deben lle%ar una cantidad #ni#a de datos si tienen cual(uier grado de fle4ibilidad. 0or ello+ las aplicaciones operacionales tienen un corto hori1onte de tie#po+ debido al dise.o de aplicaciones rgidas. 7. 'a segunda #anera en la (ue se #uestra el tie#po %ariante en el data warehouse est en la estructura cla%e. Cada estructura cla%e en el data warehouse contiene+ i#plcita o e4plcita#ente+ un ele#ento de tie#po co#o da+ se#ana+ #es+ etc. l ele#ento de tie#po est casi sie#pre al pie de la cla%e concatenada+ encontrada en el data warehouse. n ocasiones+ el ele#ento de tie#po e4istir i#plcita#ente+ co#o el caso en (ue un archi%o co#pleto se duplica al final del #es+ o al cuarto. @. 'a tercera #anera en (ue aparece el tie#po %ariante es cuando la infor#acin del data warehouse+ una %e1 registrada correcta#ente+ no puede ser actuali1ada. 'a infor#acin del data warehouse es+ para todos los propsitos prcticos+ una serie larga de 9snapshots9 2%istas instantneas3. 0or supuesto+ si los snapshots de los datos se han to#ado incorrecta#ente+ entonces pueden ser ca#biados. Asu#iendo (ue los snapshots se han to#ado adecuada#ente+ ellos no son alterados una %e1 hechos. n algunos casos puede ser no )tico+ e incluso ilegal+ alterar los snapshots en el data warehouse. 'os datos operacionales+ siendo re(ueridos a partir del #o#ento de acceso+ pueden actuali1arse de acuerdo a la necesidad.

No Vo,-ti,
'a infor#acin es 6til slo cuando es estable. 'os datos operacionales ca#bian sobre una base #o#ento a #o#ento. 'a perspecti%a #s grande+ esencial para el anlisis y la to#a de decisiones+ re(uiere una base de datos estable.

n la ,igura &- A se #uestra (ue la actuali1acin 2insertar+ borrar y #odificar3+ se hace regular#ente en el a#biente operacional sobre una base de registro por registro. 0ero la #anipulacin bsica de los datos (ue ocurre en el data warehouse es #ucho #s si#ple. Bay dos 6nicos tipos de operaciones! la carga inicial de datos y el acceso a los #is#os. &o hay actuali1acin de datos 2en el sentido general de actuali1acin3 en el depsito+ co#o una parte nor#al de procesa#iento. Bay algunas consecuencias #uy i#portantes de esta diferencia bsica+ entre el procesa#iento operacional y del data warehouse. n el ni%el de dise.o+ la necesidad de ser preca%ido para actuali1ar las ano#alas no es un factor en el data warehouse+ ya (ue no se hace la actuali1acin de datos. sto significa (ue en el ni%el fsico de dise.o+ se pueden to#ar libertades para opti#i1ar el acceso a los datos+ particular#ente al usar la nor#ali1acin y desnor#ali1acin fsica. "tra consecuencia de la si#plicidad de la operacin del data warehouse est en la tecnologa subyacente+ utili1ada para correr los datos en el depsito. =eniendo (ue soportar la actuali1acin de registro por registro en #odo on>line 2co#o es frecuente en el caso del procesa#iento operacional3 re(uiere (ue la tecnologa tenga un funda#ento #uy co#ple/o deba/o de una fachada de si#plicidad.

'a tecnologa per#ite reali1ar copias de seguridad y recuperacin+ transacciones e integridad de los datos y la deteccin y solucin al estanca#iento (ue es #s co#ple/o. n el data warehouse no es necesario el procesa#iento. 'a fuente de casi toda la infor#acin del data warehouse es el a#biente operacional. A si#ple %ista+ se puede pensar (ue hay redundancia #asi%a de datos entre los dos a#bientes. Desde luego+ la pri#era i#presin de #uchas personas se centra en la gran redundancia de datos+ entre el a#biente operacional y el a#biente de data warehouse. Dicho ra1ona#iento es superficial y de#uestra una carencia de entendi#iento con respecto a (u) ocurre en el data warehouse. De hecho+ hay una #ni#a redundancia de datos entre a#bos a#bientes. *e debe considerar lo siguiente!

'os datos se filtran cuando pasan desde el a#biente operacional al de depsito. 4iste #ucha data (ue nunca sale del a#biente operacional. *lo los datos (ue real#ente se necesitan ingresarn al a#biente de data warehouse. l hori1onte de tie#po de los datos es #uy diferente de un a#biente al otro. 'a infor#acin en el a#biente operacional es #s reciente con respecto a la del data warehouse. Desde la perspecti%a de los hori1ontes de tie#po 6nicos+ hay poca superposicin entre los a#bientes operacional y de data warehouse. l data warehouse contiene un resu#en de la infor#acin (ue no se encuentra en el a#biente operacional. 'os datos e4peri#entan una transfor#acin funda#ental cuando pasa al data warehouse. 'a #ayor parte de los datos se alteran significati%a#ente al ser seleccionados y #o%idos al data warehouse. Dicho de otra #anera+ la #ayora de los datos se alteran fsica y radical#ente cuando se #ue%en al depsito. &o es la #is#a data (ue reside en el a#biente operacional desde el punto de %ista de integracin. n %ista de estos factores+ la redundancia de datos entre los dos a#bientes es una ocurrencia rara+ (ue resulta en #enos de 1C.

DI*ERENCIA ENTRE DATEWARHAUOS


A#pe%to#

BASES

DE

DATOS

OPERACIONALES

BD oper %ion , D t W re/ou#e De tipo operati%o 2operaciones del "b/eti%o Anlisis y to#a de decisiones da a da3 De transacciones. Repetiti%o y De consultas #asi%as. 0untual y no 0roceso conocido. conocido. Acti%idad 0redo#ina la actuali1acin 0redo#ina la consulta $#portancia del tie#po de $#portancia de la respuesta Rendi#iento respuesta de la transaccin #asi%a. instantnea

A#pe%to#

BD oper %ion , D t W re/ou#e 4plotacin de la infor#acin 4plotacin de toda la infor#acin 4plotacin relacionada con la operati%a de interna y e4terna relacionada con cada aplicacin el negocio ?olatilidad Actuali1able Carga+ pero no actuali1acin 8suarios de perfiles #edios o 8suarios 8suarios de perfiles altos ba/os "rgani1acin structura nor#al#ente relacional ?isin #ultidi#ensional Datos generales desagregados+ al Datos en distintos ni%eles de Granularidad detalle detalle y agregacin Bori1onte @: a D: das E a 1: a.os histrico 0erspecti%a $#portancia del dato actual $#portancia del dato histrico ?olu#en de 0e(ue.oF#edio. Del orden del 5b 5edioFgrande. Del orden del Gb a datos a Gb. =b.

Você também pode gostar