Você está na página 1de 34

BODEGA DE DATOS

BODEGA DE DATOS

Por: Fabiola del Toro Osorio
La toma de decisiones se facilita 
La toma de decisiones se facilita
cuando se cuenta con información

En un mercado que cambia, las decisiones


se deben tomar con base al conocimiento.
conocimiento
Las bodegas de datos en la actualidad
Las bodegas de datos en la actualidad
En el 1994, Howard Dresdner de Gartner Group 
, p
predijo lo siguiente: “En el 1996, el uso de las 
soluciones de inteligencia de negocio cambiará 
dramáticamente de analistas dedicados a todos los
dramáticamente de analistas dedicados a todos los 
gerentes y profesionales como la manera preferida 
de entender el negocio. En lugar de un pequeño 
g g p q
número de analistas invirtiendo el cien por ciento de 
su tiempo analizando datos, todos los gerentes y 
profesionales invertirán el diez por ciento de su
profesionales invertirán el diez por ciento de su 
tiempo utilizando herramientas de inteligencia de 
negocio…” 
Algunas motivaciones para la 
implementación de DW
l ó d
• Visualizar detalladamente su negocio
• Optimizar sus procesos
• Alcanzar sus metas y objetivos a partir de toma de decisiones basadas en 
conocimiento
• Interés en manejar grandes volúmenes de datos en la toma de decisiones
• Manejo de múltiples y variadas fuentes de información
• Eliminar la dispersión de la información 
p
• Minimizar las inconsistencias en la información
• Facilitar el acceso a la información histórica
Algunas definiciones de DW
Algunas definiciones de DW
"Yo
Yo considero al DW como algo que provee dos 
considero al DW como algo que provee dos
beneficios empresariales reales: Integración y 
Acceso de datos DW elimina una gran
Acceso de datos. DW elimina una gran 
cantidad de datos inútiles y no deseados, 
como también el procesamiento desde el
como también el procesamiento desde el 
ambiente operacional clásico".
1993 Susan Osterfeldt
1993, Susan Osterfeldt 
Las bodegas de datos ponen a su 
Las bodegas de datos ponen a su
disposición conocimiento

“Es una colección de datos para 
p
soporte al proceso de toma de 
d ii
decisiones”.

W. H. Inmon
La construcción y uso de la bodega de 
datos para generar dicho 
conocimiento 
conocimiento
La Bodega de Datos NO es un producto, es
un proceso

Extracción Transformación Carga Visualización


El proceso de unir
datos de diferentes
fuentes, para extraer
conocimiento
El almacenamiento de datos debe ser 
El almacenamiento de datos debe ser
usado según sus propias caracteríscas

.
Orientación al
Bases de datos
operacionales proceso

Sistema de Orientación a
B d
Bodega d
de D
Datos
t T
Toma d
de
decisiones
Los datos a incluir en la bodega 
g
potencian su uso
Los datos a incluir en la bodega están asociados 
a información relevante en la organización

Ventas Conocimiento
Facturas
(Toma decisiones)

Definición
Recursos productos
Humanos
Los datos unificados
Los datos unificados
Integrada. La base de datos contiene los datos 
Integrada La base de datos contiene los datos
de todos los sistemas operacionales de la 
organización y dichos datos deben ser
organización, y dichos datos deben ser 
consistentes
Fuente1 Fuente2

Ventas Fuentes Externas

Fuentes Internas

Almacen
Definición
productos
de Datos
Los datos reflejan fotos momento a 
j
momento
Variable en el tiempo
Variable en el tiempo
Los datos permanecen en el tiempo
Los datos permanecen en el tiempo
No volátil. La información no se modifica ni se 
No volátil La información no se modifica ni se
elimina, una vez almacenado un dato, éste se 
convierte en información de sólo lectura y se
convierte en información de sólo lectura, y se 
mantiene para futuras consultas. 
Otras visiones de las bodegas de datos
Otras visiones de las bodegas de datos
Un almacén de datos es una copia de las 
p
transacciones de datos específicamente estructurada 
para la consulta y el análisis. 

Un data warehouse no es más que la unión de todos 
los Data marts de una entidad. 
los Data marts de una entidad
Definición de Ralph Kimball
Los Data mart como un medio para 
Los Data mart como un medio para
para consolidar una bodega de datos

Los Data marts son subconjuntos de datos de un data 
warehouse para áreas especificas.
para áreas especificas
Entre las características de un data mart destacan:
– Usuarios limitados. 
– Área especifica. 
– Tiene un propósito especifico. 
– Tiene una función de apoyo. 
La visualización de la información se 
La visualización de la información se
puede hacer a partir de cubos
Componentes de la bodega de datos
Componentes de la bodega de datos

Tomado de The Data Warehouse Toolkit Second Edition


The Complete Guide to Dimensional Modeling.
Modeling
Ralph Kimball, Margy Ross
Los mismos componentes pueden 
verse de diferentes maneras
d df
Herramientas de
consultas e
informes
BD 1
Fuentes Internas

Herramientas
EIS
BD 2

ETL Almacen Herramientas


OLAP
de Datos
Fuente1
Herramientas
Minería
Fuentes Externas
Fuente2
El motor de la bodega de datos maximiza el potencial 
d l d á
de los demás componentes de la solución
t d l l ió
Gartner MQ 2001 Gartner MQ 2007
Diversidad de herramientas para 
Extracción, Trasformación y Carga
ó f ó
• Suite de herramientas de Teradata
Suite de herramientas de Teradata
• Integration Services Microsoft
• S i d h
Suite de herramientas de Oracle
i d O l
• Data Integrator & Services
• Suite de herramientas de IBM
• Pentaho Data Integration (Software libre)
Pentaho Data Integration   (Software libre)
• …………
Algunos tips de las herramientas de 
ETL
• Rápido acceso a los datos
Rápido acceso a los datos
• Actualización de la información oportuna
• Escalabilidad
l bilid d
• Capacidades de reinicio
• Integración con plataformas líderes
Diversidad de herramientas para 
Visualizar la información
l l f ó
Gartner 2007

Fuente: Gartner
Desarrollo incremental y metodología 
clara de implementación
Definición de preguntas – Hacia 
dó d
dónde se orienta la organización
l ó
Visión

Metas

Objetivos

Estrategias

Factores de Éxito

Preguntas de Negocio
Se parte del análisis de los 
requerimientos de la DW
d l
Visión

Meta 1 Meta …. Meta n

Obj ti 1
Objetivo Obj ti ….
Objetivo Obj ti n
Objetivo

Estrategia 1

Factor de Éxito 1

Activos de Información
Factor de Éxito n

Estrategia …

Estratengia n
Modelando el negocio se validan los 
requerimientos y se inicia proceso 

P e rs o n a
P e r s o n a ID
E m p re s a N u m e r o Id e n t ifi c a c io n
E m p re s a ID (F K ) T i p o Id e n t ifi c a c io n ID (F K )
N o m b re
Id e n t ifi c a c i o n A p e llid o
D ir e c c i o n e m a il
T e le fo n o C a r g o ID (F K )
E m p re s a D e s c D ir e c c i o n C a s a
P a g in a W e b D ir e c c i o n T r a b a j o
C o d ig o E m p re s a T e le fo n o T r a b a jo
C a l ifi c a c io n ID (F K ) T e le fo n o c a s a
T a m a ñ o ID ( F K ) N u m e ro H ijo s
In d E m p r e s a R e c o n o c id a In d C o n y u g u e T r a b a j a
N a t u r a le z a J u r i d i c a ID (F K ) F e c h a N a c i m ie n t o
R a n g o A vis o s D ir e c t o ID (F K ) P a s a t ie m p o ID ( F K )
T ip o N o m i n a ID ( F K ) T ip o In g re s o ID (F K )
A c t i v id a d E c o n o m ic a ID (F K ) A n t ig u e d a d L a b o r a lID (F K )
I n d In d u s t r i a y C o m e r c i o S e x o ID (F K )
R a n g o S a l a r i o P r o m e d i o A d m o n ID (F K ) E s t a d o C iv i lID (F K )
R a n g o S a l a r i o P r o m e d io O p ID (F K ) N i v e l E d u c a t i v o ID (F K )
I n g r e s o E m p l e a d o ID (F K ) E s t ra t o S o c ia lID (F K )
R a n g o N u m e ro E m p le a d o s ID (F K ) T i p o V i v i e n d a ID (F K )
F e c h a In ic io M u l t i p l i c a d o r In g r e s o ID (F K )
F e c h a F in E s t a d o C li e n t e ID ( F K )
T ip o R i e s g o ID (F K ) T i p o C o n t r a t o ID (F K )
C a l ifi c a c io n E m p r e s a s ID (F K ) C i u d a d L a b o r a l ID (F K )
T ip o C o n v e n i o ID (F K ) C i u d a d R e s i d e n c i a ID (F K )
T ip o A l i a n z a ID ( F K ) In d C r e d i t o P r o v e e d o r e s
E n t id a d P r e p a g o s ID ( F K ) P e r s o n a s a C a r g o ID (F K )
E n t id a d P r e p a g a d ID ( F K ) F e c h a In ic io
F u e r z a ID (F K ) F e c h a F in
In d C o n v e n io E m p r e s a ID (F K )
P r o fe s i o n I D (F K )

C a l i fic a c i o n d e C l i e n t e s
C a l ifi c a c io n C l i e n t e ID

A c t ivid a d L a b o ra l C a l ifi c a c io n C l i e n t e D e s
A c t iv id a d L a b o r a lID
A c t iv id a d L a b o r a lD e s c C lie n t e
C l i e n t e ID
C a u s a l R e t ir o T ip o C lie n t e ID (F K ) T ip o C lie n te
C a u s a l R e t i r o ID In d C l i e n t e N u e v o
T i p o R e la c i o n ID (F K ) T i p o C l ie n t e ID
C a u s a lR e tiro D e s c In d V e h i c u l o T i p o C l ie n t e D e s c
E s t a d o C lie n t e In d P r o p i e d a d R a i z P e r fi l R ie s g o
E s t a d o C l i e n t e ID In d C a m a r a C o m e r c i o
P e r fil R i e s g o ID
In d C l i e n t e B u e n o
E s t a d o C li e n t e D e s P e r fi l R i e s g o I D ( F K ) P e r fil R i e s g o D e s c
T i p o R e la c i o n A n t ig u e d a d ID (F K ) T i p o A s o c ia d o
T i p o R e l a c io n ID E s t a d o A s o c ia d o ID (F K )
T i p o A s o c i a d o ID
C l a s i fi c a c i o n C o m e r c i a l I D ( F K )
A g e n c ia T i p o R e l a c io n D e s c E s t a d o C l i e n t e ID (F K ) T ip o A S s o c i a d o D e s c
C a u s a l R e t ir o ID (F K ) A n t ig u e d a d
A g e n c i a ID
C a l ifi c a c i o n C l i e n t e ID (F K ) A n t ig u e d a d ID
C l a s e A g e n c i a ID (F K ) A c t iv i d a d L a b o r a lID (F K )
C a l i f i c a c i o n C o n fi a r A n tig u e d a d D e s c
C iu d a d ID (F K ) T ip o A s o c ia d o ID ( F K )
C o d ig o A g e n c ia A g e n c ia ID ( F K ) C a l ifi c a c i o n C o n fia r ID
A g e n c ia D e s c C a l ifi c a c i o n C o n fia r ID (F K )
F e c h a in ic io F e c h a In ic io C a l ifi c a c i o n C o n fia r D e s
C l a s i fi c a c i o n C o m e rc ia l
F e c h a F in F e c h a F in T ip o C u e n t a
C l a s i fic a c i o n C o m e r c i a lID A le r t a ID (F K ) T ip o C u e n t a ID
C l a s i fic a c i o n C o m e r c i a lD e s c E n t i d a d I n f o r m a n t e ID (F K )
E n t i d a d F i n a n c i e r a ID (F K ) T ip o C u e n t a D e s c E n t i d a d In fo r m a n t e
E m p r e s a ID (F K ) E n t id a d In fo r m a n t e ID
P e r s o n a ID ( F K ) T ip o L o c a l
T i p o L o c a lID (F K ) E n t id a d In fo r m a n t e D e s c
A le rta A le rta C li e n t e T ip o C u e n t a ID (F K ) T ip o L o c a l ID
A le r t a ID A le r t a ID (F K ) B i e n e s ID (F K ) T ip o L o c a l D e s c
C l a s i fi c a c i o n M e r c a d e o I D ( F K )
A le rt a D e s c
C l a s i fic a c i ó n M e rc a d e o
C l a s ifi c a c io n M e r c a d e o ID
E s t a d o A s o c ia d o
B ie n e s C l a s ifi c a c io n M e rc a d e o D e s c
E s t a d o A s o c ia d o ID
B ie n e s ID
E s ta d o A s o c ia d o D e s c
B ie n e s D e s c

E n t id a d F in a n c ie r a
E n t id a d F in a n c ie r a ID
E n t id a d F in a n c ie ra D e s c
Llevan el modelo de negocios al 
modelo físico de datos
d l fí d d
P e rs o n a
P e r s o n a ID
E m p re s a N u m e r o I d e n t i fi c a c i o n
E m p r e s a ID ( F K ) T i p o Id e n t i f i c a c i o n ID ( F K )
N o m b re
I d e n t i fi c a c i o n A p e llid o
D ire c c io n e m a il
T e l e ffo n o C a r g o ID ( F K )
E m p re s a D e s c D ire c c io n C a s a
P a g in a W e b D ire c c io n T ra b a jo
C o d ig o E m p re s a T e l e fo n o T r a b a j o
C a l i f i c a c i o n ID ( F K ) T e l e fo n o c a s a
T a m a ñ o ID ( F K ) N u m e ro H ijo s
In d E m p r e s a R e c o n o c i d a In d C o n y u g u e T r a b a j a
N a t u r a l e z a J u r i d i c a ID ( F K ) F e c h a N a c im ie n t o
R a n g o A vi s o s D i r e c t o ID ( F K ) P a s a t i e m p o ID ( F K )
T i p o N o m i n a ID ( F K ) T i p o In g r e s o ID ( F K )
A c t i v i d a d E c o n o m i c a ID ( F K ) A n t i g u e d a d L a b o r a l ID ( F K )
In d In d u s t r i a y C o m e r c i o S e x o ID ( F K )
R a n g o S a l a r i o P r o m e d i o A d m o n ID ( F K ) E s t a d o C i v i l ID ( F K )
R a n g o S a l a r i o P r o m e d i o O p ID ( F K ) N i v e l E d u c a t i v o ID ( F K )
I n g r e s o E m p l e a d o ID ( F K ) E s t r a t o S o c i a l ID ( F K )
R a n g o N u m e r o E m p l e a d o s ID ( F K ) T i p o V i vi e n d a ID ( F K )
F e c h a In i c i o M u l t i p l i c a d o r In g r e s o ID ( F K )
F e c h a F in E s t a d o C l i e n t e ID ( F K )
T i p o R i e s g o ID ( F K ) T i p o C o n t r a t o ID ( F K )
C a l i f i c a c i o n E m p r e s a s ID ( F K ) C i u d a d L a b o r a l ID ( F K )
T i p o C o n v e n i o ID ( F K ) C i u d a d R e s i d e n c i a ID ( F K )
T i p o A l i a n z a ID ( F K ) In d C r e d i t o P r o v e e d o r e s
E n t i d a d P r e p a g o s ID ( F K ) P e r s o n a s a C a r g o ID ( F K )
E n t i d a d P r e p a g a d ID ( F K ) F e c h a In i c i o
F u e r z a ID ( F K ) F e c h a F in
In d C o n ve n i o E m p r e s a ID ( F K )
P r o f e s i o n ID ( F K )

C a l i fi c a c i o n d e C l i e n t e s
C a l i f i c a c i o n C l i e n t e ID

A c t ivid a d L a b o ra l C a l i fi c a c i o n C l i e n t e D e s
A c t i v i d a d L a b o r a l ID
A c t ivid a d L a b o ra lD e s c C lie n t e
C l i e n t e ID
C a u s a lR e t iro T i p o C l i e n t e ID ( F K ) T ip o C lie n t e
C a u s a l R e t i r o ID In d C l i e n t e N u e v o
T i p o R e l a c i o n ID ( F K ) T i p o C l i e n t e ID
C a u s a lR e t iro D e s c In d V e h i c u l o T ip o C lie n t e D e s c
E s t a d o C lie n t e In d P r o p i e d a d R a i z P e r fi l R i e s g o
E s t a d o C l i e n t e ID In d C a m a r a C o m e r c i o
P e r fi l R i e s g o ID
In d C l i e n t e B u e n o
E s t a d o C lie n t e D e s P e r fi l R i e s g o I D ( F K ) P e r fi l R i e s g o D e s c
T ip o R e la c io n A n t i g u e d a d ID ( F K ) T ip o A s o c ia d o
T i p o R e l a c i o n ID E s t a d o A s o c i a d o ID ( F K )
T i p o A s o c i a d o ID
C l a s i f i c a c i o n C o m e r c i a l ID ( F K )
A g e n c ia T ip o R e la c io n D e s c E s t a d o C l i e n t e ID ( F K ) T ip o A S s o c ia d o D e s c
C a u s a l R e t i r o ID ( F K ) A n t ig u e d a d
A g e n c i a ID
C a l i f i c a c i o n C l i e n t e ID ( F K ) A n t i g u e d a d ID
C la s e A g e n c i a ID ( F K ) A c t i vi d a d L a b o r a l ID ( F K )
C i u d a d ID (F K ) T i p o A s o c i a d o ID ( F K ) C a l i fi c a c i o n C o n f i a r A n t ig u e d a d D e s c
C o d ig o A g e n c ia A g e n c i a ID ( F K ) C a l i fi c a c i o n C o n f i a r I D
A g e n c ia D esc C a l i f i c a c i o n C o n fi a r ID ( F K )
F e c h a in ic io F e c h a In i c i o C a l i fi c a c i o n C o n f i a r D e s
C l a s i fi c a c i o n C o m e r c i a l
F e c h a F in F e c h a F in T ip o C u e n t a
C l a s i f i c a c i o n C o m e r c i a l ID A l e r t a ID ( F K ) T i p o C u e n t a ID
C l a s i fi c a c i o n C o m e r c i a l D e s c E n t i d a d In fo r m a n t e I D ( F K )
E n t i d a d F i n a n c i e r a ID ( F K ) T ip o C u e n t a D e s c E n t i d a d In f o r m a n t e
E m p r e s a ID ( F K ) E n t i d a d In fo r m a n t e I D
P e r s o n a ID ( F K ) T ip o L o c a l
T i p o L o c a l ID ( F K ) E n t i d a d In fo r m a n t e D e s c
A le rt a A le rt a C lie n t e T i p o C u e n t a ID ( F K ) T i p o L o c a l ID

A l e r t a ID A l e r t a ID ( F K ) B i e n e s ID ( F K ) T ip o L o c a lD e s c
C l a s i f i c a c i o n M e r c a d e o ID ( F K )
A le rt a D e s c
C l a s i fi c a c i ó n M e r c a d e o
C l a s i fi c a c i o n M e r c a d e o I D
E s t a d o A s o c ia d o
B ie n e s C l a s i fi c a c i o n M e r c a d e o D e s c
E s t a d o A s o c i a d o ID
B i e n e s ID
E s t a d o A s o c ia d o D e s c
B ie n e s D e s c

E n t id a d F in a n c ie ra
E n t i d a d F i n a n c i e r a ID
E n t id a d F in a n c ie ra D e s c
Se hace necesario identificar cuáles 
d
datos pueden llevarse al DW
d ll l
• ¿En dónde se encuentran los datos?
¿En dónde se encuentran los datos?
– Bases de datos internas
– Bases de datos Externas
• ¿Cuáles son las transformaciones necesarias 
p
para llevar los datos?
• ¿Cómo se encuentran los datos?
– Limpieza (data cleansing) 
Limpieza (data cleansing)
– Criba (selección) de datos
• Volúmen de datos
Volúmen de datos
A partir del modelo físico se 
especifican los procesos 
f l
• Extracción
Extracción. Tomando los datos de las fuentes
Tomando los datos de las fuentes
• Transformación. Ajustes a los datos para que 
sean definidos según el modelo físico
sean definidos según el modelo físico 
• Carga. Carga de datos en el DW

LIMPIEZA DE DATOS 
Las consultas son definidas y 
especificadas técnicamente
f d é
• Definición de consultas 
predefinidas a nivel de 
d f d ld
dimensiones y métricas ¿Qué paso?
¿Por qué Paso?
• Cubos o Disponibilidad de 
¿Qué pasará?
d t
datos para generación de 
ió d ¿Cómo hago que pase?
consultas ad‐hod
• Definición de consultas 
estáticas como complemento
estáticas como complemento 
en implementación mixta
• Minería de datos

IMPLEMENTACION DE CONSULTAS EXITOSAS


Las pruebas minimizan los riesgos
Las pruebas minimizan los riesgos
• Como cualquier solución la implementación de una bodega de datos debe 
ser probada
ser probada
• La calidad de los datos es vital para una buena implementación
– Una bodega de datos debe ser confiable
– La información almacenada en la bodega de datos debe ser relevante
g
– La disponibilidad de los datos en la bodega de datos debe estar acorde a los 
lineamientos de la organización
– Se debe garantizar que la integración de los datos es precisa y completa
• Los recursos necesarios para el uso de la bodega de datos son claves para 
Los recursos necesarios para el uso de la bodega de datos son claves para
el éxito del proceso
• La información debe estar disponible según el plan definido
• p y g p
Los procesos de extracción, transformación y carga deben ser probados 
Debemos partir de la historia
Debemos partir de la historia
• Cargas
Cargas históricas. El proceso de cargar la 
históricas El proceso de cargar la
información histórica es uno de los pilares del 
inicio de la bodega de datos
inicio de la bodega de datos
El proceso apenas inicia
El proceso apenas inicia
¿Tiene sentido tener una bodega de datos sin 
¿Tiene sentido tener una bodega de datos sin
actualizar?
¿Qué tan frecuente se debe actualizar?
¿Qué tan frecuente se debe actualizar?
¿Se deben actualizar los datos o se deben 
reemplazar?
l ?
¿Cómo ha sido el avance de DW?
¿Cómo ha sido el avance de DW?
• Miles
Miles de organizaciones alrededor del mundo 
de organizaciones alrededor del mundo
hoy tienen la fortuna de tomar sus decisiones 
basados en el conocimiento a partir de la
basados en el conocimiento a partir de la 
implementación de sus bodegas de datos
• En Colombia, desde grandes hasta pequeñas 
En Colombia desde grandes hasta pequeñas
empresas están obteniendo los mejores 
resultados después de haber implementado
resultados después de haber implementado 
su bodega de datos
Preguntas

Você também pode gostar