Você está na página 1de 165

Implementando un Data

Warehouse con MS SQL Server


2000 y Analysis Services
Jos Mariano lvarez Gonzlez
jose.alvarez@mug.org.ar

Agenda
Caractersticas y objetivos de los Data
Warehouses
Bases de datos involucradas
Modelos dimensionales
ETL y DTS
MDX
Herramientas del MS SQL Server 2000
Visin de Microsoft sobre BI
The more relevant, useful intelligence
you have at your fingertipsabout your
business, your customers, your partners
and your operationsthe more your
organization can make better decisions
and increase competitive advantage.
Visin de Microsoft sobre BI
La inteligencia ms til y relevante
que est disponible se encuentra
en la punta de los dedos, sus
clientes, socios y operaciones, lo
que le permitir tomar mejores
decisiones e incrementar su ventaja
competitiva.
Que da una solucin de BI
Minimizar el tiempo requerido para
obtener la informacin relevante del
negocio
Automatizar la asimilacin de la
informacin
Proveer herramientas de anlisis para
hacer comparaciones y decisiones ms
inteligentes
Cerrar el lazo desde la decisin a la
accin
Qu es un Data Warehouse ?
Es una fuente de datos de la
empresa fcilmente consultable.
Frecuentemente es la unin de los
Data Marts que lo componen.
Caractersticas de un data
warehouse
Analistas de
base de datos
Analistas
avanzados
Analistas
de negocio
Ejecutivos
Data mining
OLAP
Aplicaciones
a medida
Query tools
EIS
Preguntas de negocio
Son los requerimientos de informacin
para tomar decisiones
Peden incluir grficos o reportes
Se pueden responder con rankings,
comparaciones, parettos, semforos,
reportes, diagramas de dispersin,
paneles, etc.
Indicadores
Son los componentes de las respuestas
a las preguntas de negocio
Pueden ser simples como acumulados
Pueden ser variaciones relativas o
absolutas
Pueden ser comparaciones
Etc.
Diferencias con los sistemas
operativos o transaccionales
Comparacin (1)
OLAP

Anlisis de mtricas de
negocio por categoras
y atributos
Optimizado para la
carga masiva, consultas
grandes, complejas e
impredecibles que
acceden a muchos
registros por tabla
OLTP

Satisfacer las
operaciones de negocio
en tiempo real
Optimizada para un
conjunto de
transacciones que
habitualmente operan
sobre uno o pocos
registros por tabla
Comparacin (2)
OLAP

Cargado con datos
consistentes y vlidos.
No requiere validacin
en tiempo real
Tiene menos usuarios
concurrentes
OLTP

Optimizado para la
validacin de los datos
que se cargan durante
las transacciones
Soporta miles de
usuarios concurrentes
OLAP (1)
On Line Analytical Process
Es la actividad general de consulta y
presentacin de datos desde el data
warehouse, as como un estilo
especficamente dimensional de
consultar y presentar esos datos
CUBOS
Product
Grapes
Apples
Melons
Cherries
Pears
Q4
Time
Q1 Q2 Q3
Location
Atlanta
Denver
Detroit
1,930 UNITS
$6,745 GROSS
$5,831 COST
OLAP (2)
Tipos de almacenamiento.
Olap
Rolap - Relacional
Molap - Multidimensional
Holap - Hbrido
MOLAP
Es un conjunto de interfaces de usuario,
aplicaciones y tcnicas de base de datos
propietarias que estn orientadas a
hacia el modelo multidimensional.
Las bases de datos no son relacionales
No hay lenguajes de consulta estndar
ROLAP
Relational OLAP
Es un conjunto de interfaces y
aplicaciones que le da a una base de
datos relacional una presentacin
multidimensional.
HOLAP
Combina los modelos ROLAP y MOLAP
tratando de obtener lo mejor de cada
uno de ellos.
Data Warehouse
Elementos involucrados
Elementos bsicos

Sistemas fuente
Son los sistemas operacionales de la
empresa y cuyo propsito principal es
llevar el registro de todas las
transacciones de la empresa
Se los suele llamar legacy systems
Son los ERP, CRM, SCM, etc.
Data Stage Area
Es un rea de almacenamiento y un
conjunto de procesos que limpian,
transforman, combinan, eliminan
duplicados, archivan y preparan los
datos fuentes para ser usados en el
Data Warehouse
Es una de las etapas mas difciles en
empresas con muchos sistemas fuente
Presentation Server
Es la mquina de destino donde se
almacenan y organizan los datos para la
consulta directa por parte de los
usuarios, generadores de reportes, y
otras aplicaciones.
Dimensional Model
Es la disciplina de modelado de datos
que se suele usar en el Data Warehouse
y est especialmente preparada para
este tipo de soluciones
Sus componentes principales son las
Fact Tables y las Dimension Tables
Business process o Proceso de
Negocio
Es un conjunto coherente de
actividades de negocio que
dan sentido a los usuarios de
negocio del Data Warehouse
Data Mart
Es un subconjunto lgico del Data
Warehouse
NO ES un un conjunto de datos
sumarizados
En el modelo propuesto por Kimbal no
son elementos diseados por separado
que luego se juntan.

Bases de datos involucradas
De los sistemas operacionales.
(Suele haber ms de una)
Del proceso de extraccin,
transformacin y carga
(Puede haber ms de una)
De consulta
(Puede haber ms de una)
Procesos bsicos de un data
warehouse
Extraccin
Transformacin
Carga e indexacin
Aseguracin de
calidad
Publicacin release
Actualizacin
Armado de consultas
Data feedbak (a
legacy systems)
Auditoria
Seguridad
Backup
Modelado dimensional
Caractersticas, comparacin y
justificacin
Modelado dimensional
Es la tcnica para entregar datos a los
usuarios dentro de un Data Warehouse.
Busca presentar los datos en un
esqueleto (framework) que es intuitivo
y permite el acceso a los datos de
forma altamente eficiente
Orientada al anlisis de datos
E-R Modeling
Es una tcnica que permite eliminar la
redundancia de datos dentro del
modelo relacional
Es una disciplina dedicada a darle
importancia a las relaciones
microscpicas entre los elementos de
datos.
Orientada a las transacciones
Contras de E-R Modeling
Los usuarios no pueden entender,
recordar o navegar los modelos ER
Las herramientas generalmente no
pueden consultar en forma general los
modelos ER
El modelo ER va en contra de los
principios del Data Warehouse tales
como lo son intuitivo y eficiente.
De que estamos hablando?
Modelos dimensionales
Elementos componentes
Fact table
Tabla de hechos.
Generalmente es una tabla muy grande
Dimension tables
Tablas de dimensiones.
Generalmente son pequeas en
comparacin a la fact table
Star schema
FACT TABLE
Tablas de
dimensiones
Tablas de
dimensiones
Fact table
Los hechos ms importantes en una
fact table son los que tiene la propiedad
de ser aditivos ya que permiten
sumarizarse y obtener un resultado
agrupado
Otros hechos pueden utilizar otras
funciones de agregacin
Dimension Tables
Contienen la descripciones textuales de
la informacin
Son los puntos de entrada del Data
Warehouse
Son las categoras en las cuales se
agrupa la informacin
Mitos falsos
En los modelos dimensionales hay
menos informacin
Los modelos dimensionales son usados
para datos agregados
Metadata
Es la informacin y las caractersticas de
los modelos y los datos.
Sirve para las distintas etapas desde la
extraccin de los datos hasta la
explotacin
Es esencial para el xito a largo plazo
Metadata (2)
La de los procesos de ETL queda en el
DTS
La de los modelos y la explotacin
queda en la base del repositorio
habitualmente en C:\Program
Files\Microsoft Analysis Services
2k\Bin\msmdrep.mdb
Construccin del Data
Warehouse
Alternativas de construccin
tradicionales
Top Down
Master Database
Sumarizaciones y publicacin
Bottom Up
Data mart no relacionados (por ejemplo
departamentales)
Data warehouse Bus Architecture
Clave para entender el modelo
Para entender el modelo dimensional se
debe tener en cuenta que un solo
modelo entidad relacin se descompone
en mltiples modelos dimensionales
Como convertir un modelo E-R
en un modelo
multidimensional
Primer paso
Identificar y separar los componentes
del modelo entidad relacin en los
distintos procesos discretos de negocio,
de forma tal de poder modelarlos
separadamente
Segundo paso
Identificar y seleccionar en estos
modelos entidad relacin separados, las
tablas con relaciones muchos a muchos
y que contienen hechos numricos y
aditivos (que no son claves del modelo
ER) y determinar a partir de ellas las
fact tables
Tercer paso
Desnormalizar el resto de las tablas en
tablas planas con un solo campo clave
que se relaciona directamente con un
campo idntico en la fact table. Estas
sern las tablas de las dimensiones
Resultado
Matriz dimensional
Un conjunto de modelos dimensionales
Los star schema tienen normalmente
entre 5 y 10 dimensiones
Algunas de las dimensiones son
compartidas entre los distintos star
schema
Ejemplo de matriz dimensional
Fortalezas del modelo (1)
Al ser un esqueleto previsible permite
tanto a los sistemas de bases de datos
como a los query tools hacer fuertes
suposiciones sobre los datos de forma
tal de ayudar a la presentacin y a la
performance
Permite soportar cambio en el
comportamiento de los usuarios
Fortalezas del modelo (2)
Soporta cambios de datos o modelo
airosamente
Agregado de datos no previstos del mismo grano
que la tabla de hechos
Agregado de nuevas dimensiones siempre y
cuando un solo valor de esta nueva dimensin se
define para cada registro de hechos
Agregado de nuevos atributos de una dimensin
Agregado de niveles ms bajos en una dimensin
a partir de un momento en el tiempo
Fortalezas del modelo (3)
Hay un nmero importante de
aproximaciones estndar para
manejar situaciones comunes de
modelado el mundo de los
negocios.
Slowly changing dimensions
Heterogeneous products
Pay in advance databases
Event handling databases
Fortalezas del modelo (4)
Un nmero creciente de aplicaciones y
utilidades de software que apoyan la
tecnologa de modelado
multidimensional propuesto y que
proveen tecnologa de agregacin lo
que permite respuestas ms
performantes
Data Warehouse Bus
Architecture (DWBA)
Como realizar la construccin
Nadie cree en un una aproximacin
totalmente monoltica
Nadie defiende la aproximacin de Data
Marts aislados
Todos los lderes defienden alguna clase
de arquitectura paso a paso
Data Marts
Los Data Marts debern estar basados
en datos lo ms atmicos posibles que
se puedan obtener de los legacy
systems
El termino Data Mart expresa la
imposibilidad de la construccin de todo
el Data Warehouse completo en un
paso
Data Marts en la DWBA (1)
Comenzar la planificacin con
una completa y corta fase de
arquitectura con metas
especficas para todo el Data
Warehouse
Definir alcance
Definir implementacin
Data Marts en la DWBA (2)
Seguir con una fase de
implementacin paso a paso de
cada Data Mart
Supervisar la construccin de
cada pieza completa del Data
Warehouse
Dimensiones
Dimensiones
Es la organizacin de los atributos que
describen las cosas que componen el
modelo dimensional
Estos atributos estn fuertemente
correlacionados entre si
Si hay datos poco correlacionados suele
ser indicador de que se deben separar
en dos dimensiones
Atributos de las dimensiones
Deben ser lo ms verborrgicos
posible
Deben ser descriptivos
Deben ser completos
Deben tener calidad.
Documentados en la metadata
Deben ser descripciones cortas y no
cdigos o abreviaciones
Niveles de las dimensiones
Es la forma de agrupar los atributos de
una dimensin
Es el nombre del conjunto de miembros
de una dimensin que se encuentran a
una misma distancia de la raiz de la
jerarqua
Suele definirse un ALL (todos) que
agrupa a todos y es la raz de la
jerarqua
Se los usa para crear agregaciones
Ejemplo de niveles
Niveles de la dimensin
Dimensin
Claves (Keys)
Usar claves subrogadas, aun
para la dimensin tiempo
Evitar claves de mltiples
campos
Evitar darle significado a la
clave
Claves subrogadas
Son clave propias generadas dentro
del modelo dimensional
No son las mismas claves que la de
los sistemas operacionales
Aseguran el xito ya que tarde o
temprano los legacy systems
pueden realizar cambios que sean
incompatibles con el Data Warehouse
Creacin de dimensiones
Conformed dimensions (1)
Es una dimensin que significa
lo mismo para cada posible
fact table a la cual puede ser
asociada
Generalmente es la misma
tabla para todos los Data Mart
Conformed dimensions (2)
Es una de las mayores
responsabilidades del grupo de
diseo del Data Warehouse
Debe realizar las siguientes tareas
Establecer
Publicar
Mantener
Imponer
Conformed dimensions (3)
Sin la estricta adhesin a la
realizacin de conformed
dimensions el Data Warehouse
no puede funcionar como un
todo integrado
Conformed dimensions (4)
Si no se realizan conformed
dimensions se puede llegar a
Tener modelos que no se pueden
usar juntos
Obtener resultados errneos
Conformed dimensions (5)
Una nica dimensin puede ser usada
en mltiples tablas de hechos
Las interfaces de usuario y el contenido
de datos es consistente en todos los
lugares donde se la use
Hay una coherente interpretacin de los
atributos en todos los Data Mart
Conformed dimensions (6)
La determinacin y el diseo de estas
Conformed dimensions debera tomar
unas pocas semanas
Debern ser definidas al nivel mas
atmico posible
El uso de conformed dimensions ms
que una decisin tcnica suele ser una
decisin poltica
Dimensiones compartidas
Son las conformed dimensions
Pueden ser usadas en varios cubos
Pertenecen a una sola base de
datos
Permiten cruzar datos entre
distintos cubos
Dimensiones privadas
Son propias de un cubo
No son conformed dimensions
Limitan la navegacin cuando
se crean cubos virtuales
Snowflake (copo de nieve 1)
Se dice que una dimensin tiene
este tipo de estructura cuando est
normalizada.
Los campos de menor cardinalidad
se encuentran separados en tablas
Snowflake (copo de nieve 2)
Snowflake (copo de nieve 3)
Normalmente se argumenta ahorro de
espacio.
No suelen ser ptimas para la
navegacin (performance) en ROLAP
Los modelos son ms complejos
En Analysis Services suele ser igual de
ptimo que sin normalizar
Creacin de una dimensin en
copo de nieve (Snowflake)
Tipo de modelos segn las
dimensiones
Star
Cada dimensin se compone de 0 o 1 tabla
relacionada con la tabla de hechos
Snowflake
Todas las dimensiones estn normalizadas
Starflake
Solo alguna de las dimensiones estn
normalizadas
Dimensin tiempo (1)
Ocupa un lugar especial en cada Data
Warehouse
Cada fact table en un Data Warehouse
es una serie de tiempo de
observaciones da alguna clase
Debido a la globalizacin debe soportar
mltiples formas de visualizacin
Dimensin tiempo (2)
Creacin de la dimensin
tiempo
Slowly changing dimensions
A veces las claves de los sistemas
transaccionales no cambian pero
sus descripciones s.
Los atributos de alguna de las
dimensiones cambian
Suelen ser espordicos
Tipo 1
Sobreescribir el registro de
dimensin con los nuevos
valores
Se pierde la informacin
histrica
Tipo 2
Crear un nuevo registro con los
nuevos valores
Se requiere claves subrogadas
Permite particionar
claramente la historia para cada
valor de atributo
Tipo 3
Crear un campo OLD en la
dimensin para almacenar el
atributo inmediato previo
Se usa en cambios de la
empresa del tipo suaves o
tentativos
Cambios en Large dimension
No se pueden utilizar las tcnicas
vistas
Se debe separar en distintas tablas
Informacin constante
Informacin variable
Se debe crear atributos de tipo
banda con valores discretos
Cambios en Large dimension
Dimensiones degeneradas
Master-Detail. Cuando los datos de la
fact table son tem de
El Numero de factura, pedido, etc se
almacena en la fact table
Hablamos de una dimensin
degenerada porque si creramos una
tabla para la misma solo tendra el
atributo Nmero
Junk Dimensions
Suelen ser
Atributos que son flags de los
sistemas transaccionales
De baja cardinalidad y dispersos
La interpretacin depende del
contexto
No suele ser til
Dejarlos en la Fact table
Crear una dimensin para cada uno
Junk Dimensions
Se deben estudiar
cuidadosamente
La solucin es crear una o
varias dimensiones para todos
agrupndolos lo mximo posible
Dimensiones balanceadas y
desbalanceadas
Dimension Parent-Child (1)
Dimension Parent-Child (2)
Propiedades de miembros
Se definen en un nivel determinado
Suelen usarse para crear
dimensiones virtuales
No se crean agregaciones por estas
propiedades
Se las usa cuando el atributo esta
correlacionado con un nivel
determinado de una dimension
Dimensiones Virtuales
Es una dimensin lgica basada en
una fsica
Puede ser creada en base a
Propiedades de los niveles
Columnas de la dimension fisica
No tienen agregaciones y por lo
tanto no aumentan el espacio
requerido al procesar el cubo
Pueden ser ms lentas
La calidad de los atributos
define la calidad del Data
Warehouse
Hechos

Tipo de hechos
Aditivos
Semiaditivos
No aditivos
Hechos aditivos
Se pueden obtener mediante
medidas comunes o calculadas
Se pueden sumarizar en
cualquier dimensin
Suelen expresar actividad
Ejemplo
Dlares o unidades vendidas
Hechos semiaditivos (1)
Se suelen poder sumarizar en
cualquier dimensin excepto alguna
Suelen expresar intensidad o un
estado en un momento
determinado
No suele ser til la funcin AVG
Ejemplo
Niveles de balance
Saldos de cuentas
Hechos semiaditivos (2)
Para combinarlos a travs de la
dimensin tiempo se debe
Primero sumarizar a travs del tiempo
Dividir por el numero de periodos de
tiempo en cuestin
No es el mismo resultado que la
funcin AVG
Requieren medidas calculadas
Hechos no aditivos
No se los puede sumarizar pero
si agregar.
Se los puede promediar,
obtener el mximo, etc
Se puede usar la funcin AVG
Ejemplo
Temperatura
Diseo de la fact table
Seleccionar la fuente de datos del
Data Mart
Determinar el grano de la fact table
Seleccionar las dimensiones
Seleccionar los hechos
Tipos de grano ms usados
Transacciones individuales
Fotos de los niveles ( actividad,
endeudamiento, etc)
Items de lnea de documentos
(facturas, ordenes de compra,
etc.)
Fact tables sin hechos (1)
Describen eventos y alcance
Se las usa en situaciones
particulares donde
generalmente se hacen cuentas
y no sumarizaciones
Fact tables sin hechos (2)
Fact tables sin hechos (3)
Cubos reales
Se crean fsicamente
Contienen los datos y las
agregaciones
Contiene al menos una particin
Se pueden escribir
Cubos virtuales
Es una vista de uno o varios
cubos
No contiene datos ni
agregaciones
Contiene solo la definicin
Medidas
Define la forma en que se
agregan los datos
Pueden tener operaciones sobre
la columna
dbo.precio * dbo.cantidad
Medidas calculadas
Se obtienen a partir de otras
medidas del cubo
Se usa MDX para definirla
Pueden traer problemas de
performance
Medidads de flujo y de stock
FLUJO: Analizan un indicador
en intervalos o transacciones
Suelen ser aditivas
STOCK: Analizan fotos de la
situacin
Suelen ser semi aditivas respecto
del tiempo
Transactions Facts
Es til crear campos de auditoria
Se pueden realizar anlisis poderosos que
no se pueden realizar con datos
sumarizados
Permiten analizar comportamiento
Anlisis de colas
comportamiento secuencial
Deteccin de fraude
No dan rpida respuesta a algunas
preguntas de negocio
Snapshot facts
Son la solucin cuando las respuestas
de negocio corresponden a actividad
Permiten medir rpidamente el estado
de la empresa
Suelen estar orientadas a cuentas y
tiempo
Aparecen dimensiones de estado
Conformed fact (1)
Las conformed dimensions son el 80%
del esfuerzo de construccin de la
arquitectura del Data Warehouse. El
restante 20 % lo constituye la
identificacin de definiciones de
conformed facts,
Se realizan al mismo tiempo que las
conformed dimensions
Conformed fact (2)
Usualmente los hechos tienen
unidades naturales de medidas
idnticas para todos los
modelos
Algunas veces los hechos
pueden tener diferentes
unidades naturales de medidas
Conformed fact (3)
Algunas veces es imposible obtener
conformed facts
Por mas que se refiera a los
mismos tipos de hechos se deber
asegurar que las diferentes
interpretaciones tengan diferentes
nombres
Caractersticas de los hechos
Suelen ser numricos y rara vez
son alfanumricos
Suelen ser campos con datos en
punto flotante de los sistemas
transaccionales
Se pueden medir
Granularidad
La granularidad de las fact tables de
cada Data Mart deber estar al nivel
ms bajo de todas las dimensiones
integrantes del modelo
Cuando se hace drill down no es
inteligente perder los beneficios de la
presentacin dimensional en los
ltimos pasos
Idea fundamental
Cada tipo de de datos de negocio
puede ser representado por un
cubo con
Valores mensurables en las celdas del
cubo
Las aristas del cubo definen las
dimensiones naturales de los datos
Caractersticas de los cubos
Los modelos tienen generalmente entre
4 y 15 dimensiones
Modelos con 2 o 3 dimensiones son
raros
Modelos con mas de 15 dimensiones
suelen tener dimensiones que se
pueden combinar
Creacin de cubos
Donde comenzar
Comenzar con Data Marts de
una sola fuente de informacin
para
Minimizar riesgos
Asegurarse la implementacin
Importante
Una implementacin eficiente de un
Data Mart de una sola fuente de
informacin proveer suficientes datos
interesantes como para mantener a los
usuarios felices y tranquilos mientras se
realizan las tareas ms difciles de
construccin del resto del Data
Warehouse
Agregaciones (1)
Permiten mejorar los tiempos de
respuesta
Requieren almacenamiento adicional
Si no son controladas pueden provocar
una explosion en los requerimientos de
almacenamiento
Agregaciones (2)
Debe controlarse cuidadosamente
cuando hau muchas dimensiones y
niveles
Comenzae con un % de mejora bajo
30% o menos
Se suele mejorar las agregaciones de
acuerdo al perfil de consultas
Impacto en la performance
A mayor numero de agregaciones mas
tiempo de procesamiento y ms espacio
se requiere
A mayor numero de agregaciones es
probable que se obtenga un mejor
tiempo de respuesta de las consultas
ETL
Extraccin
Transformacin
Carga
Extraccion
Generalmente se accede a los sistemas
fuente y suele programarse en el mismo
lenguaje
Se define una periodicidad de
extraccin y se la programa
Suelen definirse interfaces en archivos
planos de texto o colas
Transformacin (1)
Validacin de datos
Valida que las filas de la tabla de
hechos tengan el correspondiente
elemento de cada una de las
dimensiones
Precisin
Valida que todos los campos tengan
valores correctos
Transformacin (2)
Conversin de tipos y datos
Se asegura que todos los valores de
un mismo campo estn almacenados
y codificados de la misma forma sin
importar cual es el sistema fuente
que lo informa.
Aplicacin de reglas de negocio
Asegura que se cumplen las reglas de
negocio
Transformacin (3)
Limpieza de datos
Normalizacion
Eliminacion de ruido
Valores perdidos
Inconsistencias
Discretizacion o generacion de
conceptos o categorias
Componentes ETL de SQL
Server
DTS
SQL Server Agent
T-SQL
Ole-DB
COM
Introduccin al MDX.
Multidimensional Expressions
Qu es MDX?
Sintaxis para definir y manipular
objetos multidimensionales.
Es equivalente al SQL para los
objetos relacionales.
No es una ampliacion del SQL.
Partes de una sentencia MDX
Cubo o cubos (alcance)
Especificacin de Ejes
Especificacion de las dimensiones
(tuplas miembro de cada dimensin),
nivel de anidamiento que aparece en
cada eje y el orden
Especificacion de slice o corte
(where)
Algunos conceptos (1)
Los datos multidimensionales se
representan en dimensiones (DIMENSION)
Las dimensiones tienen niveles en donde
hay miembros (MEMBER)
Un miembro a su vez se puede dividir en
un nivel inferior en mas miembros (LEVEL)
En cada interseccin de los miembros de
un cubo PUEDE haber medidas
(MEASURES)
Algunos conceptos (1 Bis)
Algunos conceptos (2)
CELDA es la interseccin de todas las
dimensiones de un cubo.
TUPLA es la referencia de una o de
varias celdas en cuyo caso estamos
hablando de SLICES.
SET (conjunto) es una coleccin
ordenada de tuplas.
NAMED SET es un conjunto con nombre
o alias.
Ejemplos de tuplas
(Source.[Eastern
Hemisphere].Africa, Time.[2nd
half].[4th quarter], Route.Air,
Measures.Packages)

(Source.[Eastern Hemisphere])

(Time.[2nd half], Source.[Western
Hemisphere])

Ejemplo de set
{
(Time.[1st half].[1st
quarter])
,
(Time.[2nd half].[3rd
quarter])
}

Algunos conceptos (3)
MEASURES (medidas) es
tratada como una dimensin
privada ms y de donde
generalmente se obtienen los
datos que se analizan.
Algunos conceptos (4)
Calculated Members (miembros
calculados)
Son miembros que se basan en la
evaluacin de expresiones MDX
User-Defined Functions (funciones
definidas por el usuario)
MDX provee extensibilidad mediante
estas funciones usando las interfaces
(COM).
Solo un cubo
Instruccin tpica
SELECT
<axis_specification>
[, <axis_specification>...]
FROM <cube_specification>
WHERE
<slicer_specification>
Algunos conceptos (5)
Axis
dimension
Slicer
dimension
Algunos conceptos (5 bis)
Cada dimensin en una consulta de un
cubo puede ser :
axis dimension
slicer dimension
Una dimension no puede participar de
ambas a la vez
Las dimensiones que no se explicitan en
el query se asignan automticamente
como slicer dimensions
Slicer Dimension
Criterio de seleccin
Sus miembros por defecto
(ALL) Todos sus miembros
Clausula WHERE
Where
WHERE ( [Route].[All], [Time].[1st half] )


Miembros (1)
Member name
[Time].[2nd half].[4th quarter]
Member Key
[Time].[2nd half].&[Q4]
Member Functions
Time.FirstChild (es lo mismo que
Time.[1st half] si ese es el primer
hijo)
Miembros (2)
Calculated Members
WITH MEMBER
[Measures].[PackagesForecast] AS
'[Measures].[Packages] * 1.1'
Tuplas (1)
(Time.[2nd half])

Tuplas (2)
(Time.[2nd half], Route.nonground.air)

Set Functions
{[1st quarter]:[4th quarter]}
{[1st quarter], [2nd quarter], [3rd
quarter], [4th quarter]}
Ejemplos
Importancia de las
herramientas de explotacin.

Clientes
Aplicaciones de usuario final
Aplicaciones de acceso a datos
Data report
Graph reports
Query tools
Aplicaciones de modelo
Forecasting
Socoring de comportamiento
Data Mining
Drill
Drill down
Drill down
Significa agregar mas detalle por
ejemplo agregando un atributo ms
Las herramientas de explotacin
suelen llamar:
Drill Down: agregar al reporte detalle de
nivel ms bajo dentro de la misma
dimensin
Drill To: agregar al reporte detalle de
otra dimensin
Drill up
Drill up
Anlogamente significa quitar algn detalle
dentro del reporte
Drill
Ejemplo de DRILL
Justificacin econmica para
el data warehouse
Ahorros en recursos usados en la
generacin de informacin
Ahorro por mejoras en la toma de
decisiones
Mejores resultados por mejores
decisiones
ROI habitual del 50% en los proyectos
exitosos
Muchas gracias por su
atencin
Jos Mariano lvarez Gonzlez
jose.alvarez@mug.org.ar