Você está na página 1de 18

Taller de Base de Datos

Procesamiento Analtico en Lnea


Qu es OLAP?
Imaginemos el siguiente escenario:
Una cadena de supermercados posee una (o varias) bases
de datos operacional que registra informacin sobre:
Supermercados( y sus descripciones)
Productos (y sus descripciones)
Precios de productos y promociones
Proveedores y partes entregados por ellos
Inventarios en bodegas y supermercados
Ordenes de compra a proveedores, transacciones y facturas
Transacciones de venta en cada supermercado
Programa clientes frecuentes, recursos humanos, etc.
Taller de Base de Datos

Procesamiento Analtico en Lnea Parte II

Esta base de datos est optimizada para realizar procesamiento


transaccional en lnea (OLTP), es decir esta base de datos se
encuentra totalmente optimizada.

Complejidad de la base de datos


Debido a que la base de datos est normalizada, esta tiene 500 tablas
( no es extrao encontrar base de datos con cientos de tablas).

Por ejemplo, solo para describir a los supermercados podras tener:


Taller de Base de Datos

Supermercado(SupId,Area,DireccionId,AdministradorId,)
Direccion(DireccionId,Calle,Numero,ComunaId,)
Comuna(ComunaId,AreaDeVentaId,RegionId,NumHabitantes,)
RegionId(RegionId,NumHabitantesPaisId,)
Administrador(AdministradorId,Nombre,Suledo,ContradoId,)
Contrato(ContratoId,Tipo,Texto,)
Etc.
Taller de Base de Datos

Puede ser difcil visualizar una Base de Datos de esta


naturaleza
Taller de Base de Datos

Consultas Analticas (Reportes)


Un analista de la cadena de supermercados necesita
investigar las ventas totales.
Se contacta con el administrador de la base de datos y le
solicita la siguiente informacin
Ventas totales por semana, supermercado y tipo de producto
Productos ms vendidos en los ltimos dos meses
Etc.
El administrador calcula estos datos va consultas SQL de la siguiente
forma:
Taller de Base de Datos

Consultas Analticas (Reportes)


Taller de Base de Datos

Proceso Tradicional para calcular Consultas analticas


Despus de leer el reporte, el analista observa que las ventas de la
semana 10 del ao 2002 son especialmente altas: necesita saber por
qu.

Solicita al administrador las ventas por da en la semana 10 del 2002.


Otra futuras indagaciones generan una serie de solicitudes/entregas de
reportes entre el analista y el administrador de la base de datos
Taller de Base de Datos

Data Warehouse OLAP


Idea: construyamos un sistema para el ANALISTA con las siguientes
caractersticas:
Guarde datos sobre un nico tema o proceso
Ejemplo, proceso de venta obtenido de la base de datos operacional.
No es necesario que los datos estn totalmente actualizados.
Fcil de visualizar, por ejemplo, datos organizados de acuerdo a conceptos
que sean fciles de entender para los analistas: Modelo Multidimensional.
Fcil formulacin de consultas, consultas a distintas granularidades:
Operadores.
Respuestas en el orden de los pocos segundos.
Esto es un data warehouse OLAP
Taller de Base de Datos

Arquitectura de un Data Warehouse OLAP


Taller de Base de Datos

OLTP vs OLAP
Taller de Base de Datos

Historia de OLAP

Pre-Historia
80s Bases de datos estadisticas (ej. Statistical Object
Representation Model (STORM) Rafanelli y Shoshani)
Operadores de Agregacin enBase de datos Relacionales
(SELECT-FROM-WHERE-GROUP BY)
Despegue
1993. Codd et al. Providing OLAP to user-analysts: an IT
mandate, Arbonsoft.
1995. Gray et al. Data Cube: A relational Operator Generalizing
Group-By, cross-tab and sub total
1996. Benchmark para OALP
Taller de Base de Datos

Modelo de Datos Multidimencional

El proceso a analizar se representa como:


Un conjunto de Dimensiones:
Perspectivas que usamos para visualizar el proceso.
Estructuradas como jerarquas
Generalmente pequeas.
Un conjunto de hechos (facts):
Asignaciones de mediciones a puntos en espacios formados por
dimensiones.
Agrupados en tablas de hechos
Esta tabla cambia frecuentemente.
Grande (GBs o TBs)
Taller de Base de Datos

Ejemplo: Cadena de Supermercados

Hecho: n unidades de un producto p fueron vendidas en


una fecha d por x pesos en una tienda
Dimensiones:
Producto: cdigo, descripcin, marca, categora, etc.
Lugar: cdigo, nombre, direccin, tipo, etc.
Tiempo: fecha, da, semana, mes, semestre, ao, etc.
Medidas:
Nmero de unidades.
Precio de venta.
Costo
Taller de Base de Datos

Ejemplo: Informacin Climtica

Hecho: en la latitud x, longitud y, altitud a y fecha d fue


medida una temperatura t y presin p
Dimensiones:
Latitud.
Longitud.
Altitud.
Fecha
Medidas:
Temperatura.
Presin.
Taller de Base de Datos

Ejemplo: Modelo Multidimensional de un


Buscador
Taller de Base de Datos

Esquema Estrella (Star Scheme)


Taller de Base de Datos

Esquema Copo de Nieve (Snowflake


Scheme)
Taller de Base de Datos

Tamao de las Tablas

Dimensin Tiempo: 2 aos x 365 das=730


Dimensin Lugar : 100 supermercados.
Dimensin Producto:30000 productos, 10%
vendidos cada da en cada supermercado.
Tabla de hechos: 730 x 100 x 3000= 219 millones
Tamao tabla de hechos: 219 millones x 4 ytes x 6
= 5.2 Giga- bytes

Você também pode gostar