Escolar Documentos
Profissional Documentos
Cultura Documentos
acuado por Edgar Frank Codd de EF Codd & Associates, encargado por Arbor Software
(en la actualidad Hyperion Solutions), es una base de datos multidimensional, en la cual el
almacenamiento fsico de los datos se realiza en un vector multidimensional.
Los cubos OLAP se pueden considerar como una ampliacin de las dos dimensiones de
una hoja de clculo.
A menudo se pensaba que todo lo que los usuarios pueden querer de un sistema de
informacin se podra hacer de una base de datos relacional. No obstante Codd fue uno
de los precursores de las bases de datos relacionales, por lo que sus opiniones fueron y
son respetadas.
ndice
[ocultar]
1 Introduccin
2 Un ejemplo
3 Dimensiones y jerarquas
6 Definicin tcnica
7 Vase tambin
Introduccin[editar]
La propuesta de Codd consista en realizar una disposicin de los datos en vectores para
permitir un anlisis rpido. Estos vectores son llamados cubos. Disponer los datos en
cubos evita una limitacin de las bases de datos relacionales, que no son muy adecuadas
para el anlisis instantneo de grandes cantidades de datos. Las bases de datos
relacionales son ms adecuados para registrar datos provenientes de transacciones
(conocido como OLTP o procesamiento de transacciones en lnea). Aunque existen
muchas herramientas de generacin de informes para bases de datos relacionales, stas
son lentas cuando debe explorarse toda la base de datos.
Por ejemplo, una empresa podra analizar algunos datos financieros por producto, por
perodo, por ciudad, por tipo de ingresos y de gastos, y mediante la comparacin de los
datos reales con un presupuesto. Estos parmetros en funcin de los cuales se analizan
los datos se conocen como dimensiones. Para acceder a los datos slo es necesario
indexarlos a partir de los valores de las dimensiones o ejes.
El almacenar fsicamente los datos de esta forma tiene sus pros y sus contras. Por
ejemplo, en estas bases de datos las consultas de seleccin son muy rpidas (de hecho,
casi instantneas). Pero uno de los problemas ms grandes de esta forma de
almacenamiento es que una vez poblada la base de datos sta no puede recibir cambios
en su estructura. Para ello sera necesario redisear el cubo.
En un sistema OLAP puede haber ms de tres dimensiones, por lo que a
los cubos OLAP tambin reciben el nombre de hipercubos. Las herramientas
comerciales OLAP tienen diferentes mtodos de creacin y vinculacin de estos cubos o
hipercubos (vase Tipos de OLAP en el artculo sobre OLAP).
Un ejemplo[editar]
Un analista financiero podra querer ver los datos de diversas formas, por ejemplo,
visualizndolos en funcin de todas las ciudades (que podran figurar en el eje de
abscisas) y todos los productos (en el eje de ordenadas), y esto podra ser para un perodo
determinado, para la versin y el tipo de gastos. Despus de haber visto los datos de esta
forma particular el analista podra entonces querer ver los datos de otra manera y poder
hacerlo de forma inmediata. El cubo podra adoptar una nueva orientacin para que los
datos aparezcan ahora en funcin de los perodos y el tipo de coste. Debido a que esta
reorientacin implica resumir una cantidad muy grande de datos, esta nueva vista de los
datos se debe generar de manera eficiente para no malgastar el tiempo del analista, es
decir, en cuestin de segundos, en lugar de las horas que seran necesarias en una base
de datos relacional convencional.
Dimensiones y jerarquas[editar]
Cada una de las dimensiones de un cubo OLAP puede resumirse mediante una jerarqua.
Por ejemplo si se considera una escala (o dimensin) temporal "Mayo de 2005" se puede
incluir en "Segundo Trimestre de 2005", que a su vez se incluye en "Ao 2005". De igual
manera, otra dimensin de un cubo que refleje una situacin geogrfica, las ciudades se
pueden incluir en regiones, pases o regiones mundiales; los productos podran clasificarse
por categoras, y las partidas de gastos podran agruparse en tipos de gastos. En cambio,
el analista podra comenzar en un nivel muy resumido, como por ejemplo el total de la
diferencia entre los resultados reales y lo presupuestado, para posteriormente descender
en el cubo (en sus jerarquas) para poder observar con un mayor nivel de detalle que le
permita descubrir en el cubo los lugares en los que se ha producido esta diferencia, segn
los productos y perodos.
disperso, a veces es mejor crear otro cubo distinto, pero vinculado, en el que un
subconjunto de los datos se pueden analizar con gran detalle. La vinculacin asegura que
los datos de los dos cubos mantengan una coherencia.
OLAP
OLAP es el acrnimo en ingls de procesamiento analtico en lnea (On-Line Analytical
Processing). Es una solucin utilizada en el campo de la llamada Inteligencia
empresarial(o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes
cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que
contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales
(OLTP). Se usa en informes de negocios de ventas, marketing, informes de
direccin, minera de datos y reas similares.
La razn de usar OLAP para las consultas es la rapidez de respuesta. Una base de datos
relacional almacena entidades en tablas discretas si han sido normalizadas. Esta
estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es
relativamente lenta. Un modelo mejor para bsquedas (aunque peor desde el punto de
vista operativo) es una base de datos multidimensional.
La principal caracterstica que potencia a OLAP, es que es lo ms rpido a la hora de
ejecutar sentencias SQL de tipo SELECT, en contraposicin con OLTP que es la mejor
opcin para operaciones de tipo INSERT, UPDATE Y DELETE [cita requerida].
ndice
[ocultar]
1 Funcionalidad
2.1 ROLAP
2.2 MOLAP
2.4 Comparacin
3 Vase tambin
4 Enlaces externos
Funcionalidad[editar]
En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP (tambin
llamado cubo multidimensional o hipercubo). Se compone de hechos numricos
omedidas, que se clasifican por dimensiones. El cubo de metadatos es tpicamente
creado a partir de un esquema en estrella o copo de nieve, esquema de las tablas en una
base de datos relacional. Las medidas se obtienen de los registros de una tabla de hechos
y las dimensiones se derivan de la dimensin de los cuadros.
ROLAP[editar]
Artculo principal: ROLAP
Implementacin OLAP que almacena los datos en un motor relacional. Tpicamente, los
datos son detallados, evitando las agregaciones y las tablas se encuentran
desnormalizadas Los esquemas ms comunes sobre los que se trabaja son estrella copo
de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. La
arquitectura est compuesta por un servidor de banco de datos relacional y el motor OLAP
se encuentra en un servidor dedicado. La principal ventaja de esta arquitectura es que
permite el anlisis de una enorme cantidad de datos.
MOLAP[editar]
Artculo principal: MOLAP
Esta implementacin OLAP almacena los datos en una base de datos multidimensional.
Para optimizar los tiempos de respuesta, el resumen de la informacin es usualmente
calculado por adelantado. Estos valores precalculados o agregaciones son la base de las
ganancias de desempeo de este sistema. Algunos sistemas utilizan tcnicas de
compresin de datos para disminuir el espacio de almacenamiento en disco debido a los
valores precalculados.
Comparacin[editar]
Cada sistema OLAP tiene ciertos beneficios (aunque existe desacuerdo acerca de las
caractersticas especficas de los beneficios entre los proveedores).
Algunas implementaciones MOLAP son propensas a la "explosin" de la base de datos;
este fenmeno provoca la necesidad de grandes cantidades de espacio de
almacenamiento para el uso de una base de datos MOLAP cuando se dan ciertas
condiciones: elevado nmero de dimensiones, resultados precalculados y escasos datos
multidimensionales. Las tcnicas habituales de atenuacin de la explosin de la base de
datos no son todo lo eficientes que sera deseable.
Por lo general MOLAP ofrece mejor rendimiento debido a la especializada indexacin y a
las optimizaciones de almacenamiento. MOLAP tambin necesita menos espacio de
almacenamiento en comparacin con los especializados ROLAP porque su
almacenamiento especializado normalmente incluye tcnicas de compresin.
ROLAP es generalmente ms escalable. Sin embargo, el gran volumen de
preprocesamiento es difcil de implementar eficientemente por lo que con frecuencia se
omite; por tanto, el rendimiento de una consulta ROLAP puede verse afectado.
Desde la aparicin de ROLAP van apareciendo nuevas versiones de bases de datos
preparadas para realizar clculos, las funciones especializadas que se pueden utilizar
tienen ms limitaciones.
HOLAP (OLAP Hbrido) engloba un conjunto de tcnicas que tratan de
combinar MOLAP y ROLAP de la mejor forma posible. Generalmente puede pre-procesar
rpidamente, escala bien, y proporciona una buena funcin de apoyo.
Otros tipos[editar]
Los siguientes acrnimos a veces tambin se utilizan, aunque no son sistemas tan
generalizados como los anteriores:
Vase tambin[editar]
Cubo OLAP
ROLAP
MOLAP
OLTP
AQL
Minera de datos
Enlaces externos[editar]
Introduction to OLAP
OLAP.com
Qu es OLAP?
Te has enterado de algo? No? Pues tal vez te ayude esta imagen:
En un sistema OLAP, los datos de se pueden acceder desde las distintas dimensiones
empresariales (tpicamente: por tiempo, por producto, por cliente, por red comercial).
Todava no? Pues aqu tienes una explicacin mucho mejor (via TodoBI). Esto es OLAP:
A partir de esta definicin bsica, existen distintas tecnologas que lo implementan (ROLAP,
MOLAP,...), pero bsicamente todas hacen las mismas acciones bsicas sobre la informacin:
Segmentar: Como cuando pides las ventas por producto y por trimestre
Filtrar: Como cuando pides el informe de ventas de Espaa en 2011
Profundizar (Drill down): Como cuando ves los datos de trimestre 2 y te interesa el desglose de
abril, mayo, junio.
Sintetizar (Drill up): Cuando deshacesel desglose anterior y vuelves al desglose por trimestre.
Rotar (Drill anywhere): Cuando en lugar de pasar de un desglose por trimestres a uno mensual,
te interesa un desglose por familia de producto, o por nacionalidad, es decir, por una
caracterstica de una jerarqua distinta a la que lo estas viendo actualmente.
No s si la enumeracin anterior es completa o clara. Sospecho que no. En cualquier caso, lo
relevante es que el anlisis OLAP te permite navegar fcilmente por la informacin,
solicitndola con el detalle preciso y con los filtros adecuados, y que puedes hacerlo de
manera dinmica, fcil, ad hoc, sobre la marcha, sin necesitar asistencia, rpido, y utilizando el
lenguaje de negocio. Vamos, como la seora del vdeo.
Offtopic: En nuestro otro blog hoy tambin hemos publicado un artculo. Tal vez te interese
suscribirte tambin a ese otro blog de Business Intelligence. (Google: Esto va por ti, tambin).
:-)