Escolar Documentos
Profissional Documentos
Cultura Documentos
BODEGA DE DATOS
Por: Fabiola del Toro Osorio
La toma de decisiones se facilita
La toma de decisiones se facilita
cuando se cuenta con información
“Es una colección de datos para
p
soporte al proceso de toma de
d ii
decisiones”.
”
W. H. Inmon
La construcción y uso de la bodega de
datos para generar dicho
conocimiento
conocimiento
La Bodega de Datos NO es un producto, es
un proceso
.
Orientación al
Bases de datos
operacionales proceso
Sistema de Orientación a
B d
Bodega d
de D
Datos
t T
Toma d
de
decisiones
Los datos a incluir en la bodega
g
potencian su uso
Los datos a incluir en la bodega están asociados
a información relevante en la organización
Ventas Conocimiento
Facturas
(Toma decisiones)
Definición
Recursos productos
Humanos
Los datos unificados
Los datos unificados
Integrada. La base de datos contiene los datos
Integrada La base de datos contiene los datos
de todos los sistemas operacionales de la
organización y dichos datos deben ser
organización, y dichos datos deben ser
consistentes
Fuente1 Fuente2
Fuentes Internas
Almacen
Definición
productos
de Datos
Los datos reflejan fotos momento a
j
momento
Variable en el tiempo
Variable en el tiempo
Los datos permanecen en el tiempo
Los datos permanecen en el tiempo
No volátil. La información no se modifica ni se
No volátil La información no se modifica ni se
elimina, una vez almacenado un dato, éste se
convierte en información de sólo lectura y se
convierte en información de sólo lectura, y se
mantiene para futuras consultas.
Otras visiones de las bodegas de datos
Otras visiones de las bodegas de datos
Un almacén de datos es una copia de las
p
transacciones de datos específicamente estructurada
para la consulta y el análisis.
Un data warehouse no es más que la unión de todos
los Data marts de una entidad.
los Data marts de una entidad
Definición de Ralph Kimball
Los Data mart como un medio para
Los Data mart como un medio para
para consolidar una bodega de datos
Los Data marts son subconjuntos de datos de un data
warehouse para áreas especificas.
para áreas especificas
Entre las características de un data mart destacan:
– Usuarios limitados.
– Área especifica.
– Tiene un propósito especifico.
– Tiene una función de apoyo.
La visualización de la información se
La visualización de la información se
puede hacer a partir de cubos
Componentes de la bodega de datos
Componentes de la bodega de datos
Herramientas
EIS
BD 2
Fuente: Gartner
Desarrollo incremental y metodología
clara de implementación
Definición de preguntas – Hacia
dó d
dónde se orienta la organización
l ó
Visión
Metas
Objetivos
Estrategias
Factores de Éxito
Preguntas de Negocio
Se parte del análisis de los
requerimientos de la DW
d l
Visión
Obj ti 1
Objetivo Obj ti ….
Objetivo Obj ti n
Objetivo
Estrategia 1
Factor de Éxito 1
Activos de Información
Factor de Éxito n
Estrategia …
Estratengia n
Modelando el negocio se validan los
requerimientos y se inicia proceso
P e rs o n a
P e r s o n a ID
E m p re s a N u m e r o Id e n t ifi c a c io n
E m p re s a ID (F K ) T i p o Id e n t ifi c a c io n ID (F K )
N o m b re
Id e n t ifi c a c i o n A p e llid o
D ir e c c i o n e m a il
T e le fo n o C a r g o ID (F K )
E m p re s a D e s c D ir e c c i o n C a s a
P a g in a W e b D ir e c c i o n T r a b a j o
C o d ig o E m p re s a T e le fo n o T r a b a jo
C a l ifi c a c io n ID (F K ) T e le fo n o c a s a
T a m a ñ o ID ( F K ) N u m e ro H ijo s
In d E m p r e s a R e c o n o c id a In d C o n y u g u e T r a b a j a
N a t u r a le z a J u r i d i c a ID (F K ) F e c h a N a c i m ie n t o
R a n g o A vis o s D ir e c t o ID (F K ) P a s a t ie m p o ID ( F K )
T ip o N o m i n a ID ( F K ) T ip o In g re s o ID (F K )
A c t i v id a d E c o n o m ic a ID (F K ) A n t ig u e d a d L a b o r a lID (F K )
I n d In d u s t r i a y C o m e r c i o S e x o ID (F K )
R a n g o S a l a r i o P r o m e d i o A d m o n ID (F K ) E s t a d o C iv i lID (F K )
R a n g o S a l a r i o P r o m e d io O p ID (F K ) N i v e l E d u c a t i v o ID (F K )
I n g r e s o E m p l e a d o ID (F K ) E s t ra t o S o c ia lID (F K )
R a n g o N u m e ro E m p le a d o s ID (F K ) T i p o V i v i e n d a ID (F K )
F e c h a In ic io M u l t i p l i c a d o r In g r e s o ID (F K )
F e c h a F in E s t a d o C li e n t e ID ( F K )
T ip o R i e s g o ID (F K ) T i p o C o n t r a t o ID (F K )
C a l ifi c a c io n E m p r e s a s ID (F K ) C i u d a d L a b o r a l ID (F K )
T ip o C o n v e n i o ID (F K ) C i u d a d R e s i d e n c i a ID (F K )
T ip o A l i a n z a ID ( F K ) In d C r e d i t o P r o v e e d o r e s
E n t id a d P r e p a g o s ID ( F K ) P e r s o n a s a C a r g o ID (F K )
E n t id a d P r e p a g a d ID ( F K ) F e c h a In ic io
F u e r z a ID (F K ) F e c h a F in
In d C o n v e n io E m p r e s a ID (F K )
P r o fe s i o n I D (F K )
C a l i fic a c i o n d e C l i e n t e s
C a l ifi c a c io n C l i e n t e ID
A c t ivid a d L a b o ra l C a l ifi c a c io n C l i e n t e D e s
A c t iv id a d L a b o r a lID
A c t iv id a d L a b o r a lD e s c C lie n t e
C l i e n t e ID
C a u s a l R e t ir o T ip o C lie n t e ID (F K ) T ip o C lie n te
C a u s a l R e t i r o ID In d C l i e n t e N u e v o
T i p o R e la c i o n ID (F K ) T i p o C l ie n t e ID
C a u s a lR e tiro D e s c In d V e h i c u l o T i p o C l ie n t e D e s c
E s t a d o C lie n t e In d P r o p i e d a d R a i z P e r fi l R ie s g o
E s t a d o C l i e n t e ID In d C a m a r a C o m e r c i o
P e r fil R i e s g o ID
In d C l i e n t e B u e n o
E s t a d o C li e n t e D e s P e r fi l R i e s g o I D ( F K ) P e r fil R i e s g o D e s c
T i p o R e la c i o n A n t ig u e d a d ID (F K ) T i p o A s o c ia d o
T i p o R e l a c io n ID E s t a d o A s o c ia d o ID (F K )
T i p o A s o c i a d o ID
C l a s i fi c a c i o n C o m e r c i a l I D ( F K )
A g e n c ia T i p o R e l a c io n D e s c E s t a d o C l i e n t e ID (F K ) T ip o A S s o c i a d o D e s c
C a u s a l R e t ir o ID (F K ) A n t ig u e d a d
A g e n c i a ID
C a l ifi c a c i o n C l i e n t e ID (F K ) A n t ig u e d a d ID
C l a s e A g e n c i a ID (F K ) A c t iv i d a d L a b o r a lID (F K )
C a l i f i c a c i o n C o n fi a r A n tig u e d a d D e s c
C iu d a d ID (F K ) T ip o A s o c ia d o ID ( F K )
C o d ig o A g e n c ia A g e n c ia ID ( F K ) C a l ifi c a c i o n C o n fia r ID
A g e n c ia D e s c C a l ifi c a c i o n C o n fia r ID (F K )
F e c h a in ic io F e c h a In ic io C a l ifi c a c i o n C o n fia r D e s
C l a s i fi c a c i o n C o m e rc ia l
F e c h a F in F e c h a F in T ip o C u e n t a
C l a s i fic a c i o n C o m e r c i a lID A le r t a ID (F K ) T ip o C u e n t a ID
C l a s i fic a c i o n C o m e r c i a lD e s c E n t i d a d I n f o r m a n t e ID (F K )
E n t i d a d F i n a n c i e r a ID (F K ) T ip o C u e n t a D e s c E n t i d a d In fo r m a n t e
E m p r e s a ID (F K ) E n t id a d In fo r m a n t e ID
P e r s o n a ID ( F K ) T ip o L o c a l
T i p o L o c a lID (F K ) E n t id a d In fo r m a n t e D e s c
A le rta A le rta C li e n t e T ip o C u e n t a ID (F K ) T ip o L o c a l ID
A le r t a ID A le r t a ID (F K ) B i e n e s ID (F K ) T ip o L o c a l D e s c
C l a s i fi c a c i o n M e r c a d e o I D ( F K )
A le rt a D e s c
C l a s i fic a c i ó n M e rc a d e o
C l a s ifi c a c io n M e r c a d e o ID
E s t a d o A s o c ia d o
B ie n e s C l a s ifi c a c io n M e rc a d e o D e s c
E s t a d o A s o c ia d o ID
B ie n e s ID
E s ta d o A s o c ia d o D e s c
B ie n e s D e s c
E n t id a d F in a n c ie r a
E n t id a d F in a n c ie r a ID
E n t id a d F in a n c ie ra D e s c
Llevan el modelo de negocios al
modelo físico de datos
d l fí d d
P e rs o n a
P e r s o n a ID
E m p re s a N u m e r o I d e n t i fi c a c i o n
E m p r e s a ID ( F K ) T i p o Id e n t i f i c a c i o n ID ( F K )
N o m b re
I d e n t i fi c a c i o n A p e llid o
D ire c c io n e m a il
T e l e ffo n o C a r g o ID ( F K )
E m p re s a D e s c D ire c c io n C a s a
P a g in a W e b D ire c c io n T ra b a jo
C o d ig o E m p re s a T e l e fo n o T r a b a j o
C a l i f i c a c i o n ID ( F K ) T e l e fo n o c a s a
T a m a ñ o ID ( F K ) N u m e ro H ijo s
In d E m p r e s a R e c o n o c i d a In d C o n y u g u e T r a b a j a
N a t u r a l e z a J u r i d i c a ID ( F K ) F e c h a N a c im ie n t o
R a n g o A vi s o s D i r e c t o ID ( F K ) P a s a t i e m p o ID ( F K )
T i p o N o m i n a ID ( F K ) T i p o In g r e s o ID ( F K )
A c t i v i d a d E c o n o m i c a ID ( F K ) A n t i g u e d a d L a b o r a l ID ( F K )
In d In d u s t r i a y C o m e r c i o S e x o ID ( F K )
R a n g o S a l a r i o P r o m e d i o A d m o n ID ( F K ) E s t a d o C i v i l ID ( F K )
R a n g o S a l a r i o P r o m e d i o O p ID ( F K ) N i v e l E d u c a t i v o ID ( F K )
I n g r e s o E m p l e a d o ID ( F K ) E s t r a t o S o c i a l ID ( F K )
R a n g o N u m e r o E m p l e a d o s ID ( F K ) T i p o V i vi e n d a ID ( F K )
F e c h a In i c i o M u l t i p l i c a d o r In g r e s o ID ( F K )
F e c h a F in E s t a d o C l i e n t e ID ( F K )
T i p o R i e s g o ID ( F K ) T i p o C o n t r a t o ID ( F K )
C a l i f i c a c i o n E m p r e s a s ID ( F K ) C i u d a d L a b o r a l ID ( F K )
T i p o C o n v e n i o ID ( F K ) C i u d a d R e s i d e n c i a ID ( F K )
T i p o A l i a n z a ID ( F K ) In d C r e d i t o P r o v e e d o r e s
E n t i d a d P r e p a g o s ID ( F K ) P e r s o n a s a C a r g o ID ( F K )
E n t i d a d P r e p a g a d ID ( F K ) F e c h a In i c i o
F u e r z a ID ( F K ) F e c h a F in
In d C o n ve n i o E m p r e s a ID ( F K )
P r o f e s i o n ID ( F K )
C a l i fi c a c i o n d e C l i e n t e s
C a l i f i c a c i o n C l i e n t e ID
A c t ivid a d L a b o ra l C a l i fi c a c i o n C l i e n t e D e s
A c t i v i d a d L a b o r a l ID
A c t ivid a d L a b o ra lD e s c C lie n t e
C l i e n t e ID
C a u s a lR e t iro T i p o C l i e n t e ID ( F K ) T ip o C lie n t e
C a u s a l R e t i r o ID In d C l i e n t e N u e v o
T i p o R e l a c i o n ID ( F K ) T i p o C l i e n t e ID
C a u s a lR e t iro D e s c In d V e h i c u l o T ip o C lie n t e D e s c
E s t a d o C lie n t e In d P r o p i e d a d R a i z P e r fi l R i e s g o
E s t a d o C l i e n t e ID In d C a m a r a C o m e r c i o
P e r fi l R i e s g o ID
In d C l i e n t e B u e n o
E s t a d o C lie n t e D e s P e r fi l R i e s g o I D ( F K ) P e r fi l R i e s g o D e s c
T ip o R e la c io n A n t i g u e d a d ID ( F K ) T ip o A s o c ia d o
T i p o R e l a c i o n ID E s t a d o A s o c i a d o ID ( F K )
T i p o A s o c i a d o ID
C l a s i f i c a c i o n C o m e r c i a l ID ( F K )
A g e n c ia T ip o R e la c io n D e s c E s t a d o C l i e n t e ID ( F K ) T ip o A S s o c ia d o D e s c
C a u s a l R e t i r o ID ( F K ) A n t ig u e d a d
A g e n c i a ID
C a l i f i c a c i o n C l i e n t e ID ( F K ) A n t i g u e d a d ID
C la s e A g e n c i a ID ( F K ) A c t i vi d a d L a b o r a l ID ( F K )
C i u d a d ID (F K ) T i p o A s o c i a d o ID ( F K ) C a l i fi c a c i o n C o n f i a r A n t ig u e d a d D e s c
C o d ig o A g e n c ia A g e n c i a ID ( F K ) C a l i fi c a c i o n C o n f i a r I D
A g e n c ia D esc C a l i f i c a c i o n C o n fi a r ID ( F K )
F e c h a in ic io F e c h a In i c i o C a l i fi c a c i o n C o n f i a r D e s
C l a s i fi c a c i o n C o m e r c i a l
F e c h a F in F e c h a F in T ip o C u e n t a
C l a s i f i c a c i o n C o m e r c i a l ID A l e r t a ID ( F K ) T i p o C u e n t a ID
C l a s i fi c a c i o n C o m e r c i a l D e s c E n t i d a d In fo r m a n t e I D ( F K )
E n t i d a d F i n a n c i e r a ID ( F K ) T ip o C u e n t a D e s c E n t i d a d In f o r m a n t e
E m p r e s a ID ( F K ) E n t i d a d In fo r m a n t e I D
P e r s o n a ID ( F K ) T ip o L o c a l
T i p o L o c a l ID ( F K ) E n t i d a d In fo r m a n t e D e s c
A le rt a A le rt a C lie n t e T i p o C u e n t a ID ( F K ) T i p o L o c a l ID
A l e r t a ID A l e r t a ID ( F K ) B i e n e s ID ( F K ) T ip o L o c a lD e s c
C l a s i f i c a c i o n M e r c a d e o ID ( F K )
A le rt a D e s c
C l a s i fi c a c i ó n M e r c a d e o
C l a s i fi c a c i o n M e r c a d e o I D
E s t a d o A s o c ia d o
B ie n e s C l a s i fi c a c i o n M e r c a d e o D e s c
E s t a d o A s o c i a d o ID
B i e n e s ID
E s t a d o A s o c ia d o D e s c
B ie n e s D e s c
E n t id a d F in a n c ie ra
E n t i d a d F i n a n c i e r a ID
E n t id a d F in a n c ie ra D e s c
Se hace necesario identificar cuáles
d
datos pueden llevarse al DW
d ll l
• ¿En dónde se encuentran los datos?
¿En dónde se encuentran los datos?
– Bases de datos internas
– Bases de datos Externas
• ¿Cuáles son las transformaciones necesarias
p
para llevar los datos?
• ¿Cómo se encuentran los datos?
– Limpieza (data cleansing)
Limpieza (data cleansing)
– Criba (selección) de datos
• Volúmen de datos
Volúmen de datos
A partir del modelo físico se
especifican los procesos
f l
• Extracción
Extracción. Tomando los datos de las fuentes
Tomando los datos de las fuentes
• Transformación. Ajustes a los datos para que
sean definidos según el modelo físico
sean definidos según el modelo físico
• Carga. Carga de datos en el DW
LIMPIEZA DE DATOS
Las consultas son definidas y
especificadas técnicamente
f d é
• Definición de consultas
predefinidas a nivel de
d f d ld
dimensiones y métricas ¿Qué paso?
¿Por qué Paso?
• Cubos o Disponibilidad de
¿Qué pasará?
d t
datos para generación de
ió d ¿Cómo hago que pase?
consultas ad‐hod
• Definición de consultas
estáticas como complemento
estáticas como complemento
en implementación mixta
• Minería de datos