Você está na página 1de 40

OLAP

Proceso Analítico en Línea

Asignatura

Docente Ing. Marco Aurelio Porro Chulli

Carrera P. Ing. Sistemas y Telemática – “B”

Integrantes:
o Maldonado Idrogo Betzabeth Yameli
o Pérez Saucedo Yordin Alberto
Procesamiento Analítico en Línea

Índice
I. INTRODUCCION ................................................................................................................................ 3
1. Contenido ........................................................................................................................................... 4
1.1. Definición.................................................................................................................................... 4
1.2. Arquitectura OLAP ................................................................................................................... 4
1.3. Características Básicas del OLAP ....................................................................................... 7
1.3.1. OLAP Relacional ............................................................................................................... 7
1.3.2. OLAP Multidimensional ................................................................................................ 11
1.3.3. OLAP Dimensional vs. OLAP Multidimensional. ................................................... 14
1.4. Extensiones de SQL para OLAP ......................................................................................... 16
1.4.1. La Extensión ROLLUP................................................................................................... 17
1.4.2. La Extensión Cube ......................................................................................................... 18
1.4.3. Vistas Materializadas ..................................................................................................... 19
2. Resumen ........................................................................................................................................... 32
3. Summary ........................................................................................................................................... 33
4. Recomendaciones.......................................................................................................................... 34
7. Glosario De Términos ................................................................................................................... 35
8. Bibliografía o Linkografía ............................................................................................................. 38

Base de Datos II 1
Procesamiento Analítico en Línea

ÍNDICE DE FIGURAS
FIGURA 1 ARQUITECTURA CLIENTE/SERVIDOR DE UN OLAP ..................................................................................... 5
FIGURA 2 SERVIDOR OLAP CON MINIMERCADOS DE DATOS ...................................................................................... 6
ILUSTRACIÓN 3 ARQUITECTURA CLIENTE/SERVIDOR MOLAP .................................................................................. 14
FIGURA 4 INTEGRACIÓN DE OLAP CON UN PROGRAMA DE HOJA DE CÁLCULO ....................................................... 16
FIGURA 5 ESQUEMA DE COPO DE NIEVE ............................................................................................................................... 17
FIGURA 6 EXTENSIÓN ROLLUP ................................................................................................................................. 18
FIGURA 7 EXTENSIÓN CUBE ...................................................................................................................................... 19
FIGURA 8 CREACIÓN DE UNA VISTA MATERIALIZADA ................................................................................................. 22
FIGURA 9 ACTUALIZACIÓN DE UNA VISTA MATERIALIZADA ........................................................................................ 23
ILUSTRACIÓN 10 MUESTRAS DE APLICACIONES OLAP ............................................................................................. 24
FIGURA 11 CREACIÓN DE LA BD ................................................................................................................................ 25
FIGURA 12 ICONO DE EXCEL....................................................................................................................................... 25
FIGURA 13 SELECCIÓN DE CELDA .............................................................................................................................. 25
FIGURA 14 CINTA DATOS ............................................................................................................................................ 26
FIGURA 15 OBTENER DATOS ...................................................................................................................................... 26
FIGURA 16 DESDE FUENTE DE DATOS ........................................................................................................................ 26
FIGURA 17 DESDE ASISTENTE .................................................................................................................................... 26
FIGURA 18 ASISTENTE DE CONEXION DE DATOS I ...................................................................................................... 27
FIGURA 19 PROPIEDADES DE CONEXIÓN .................................................................................................................... 27
FIGURA 20 INICIO DE SESIÓN ...................................................................................................................................... 28
FIGURA 21 ASISTENTE DE CONEXIÓN DE DATOS I ...................................................................................................... 28
FIGURA 22 TERMINAR LA CONEXIÓN .......................................................................................................................... 29
FIGURA 23 IMPORTANDO DATOS ................................................................................................................................. 29
FIGURA 24 MUESTRA DE DATOS ................................................................................................................................. 30
FIGURA 25 MUESTRA DE DATOS ................................................................................................................................. 31
FIGURA 26 AGREGAR MÁS TABLAS ............................................................................................................................ 31
FIGURA 27 RESULTADO FINAL ................................................................................................................................... 32
ÍNDICES DE TABLAS

TABLA 1 REPRESENTACIÓN DE VALORES EN MAPA DE BITS .................................................................................... 10


TABLA 2 OLAP RELACIONAL VS OLAP MULTIDIMENSIONAL ................................................................................... 15

Base de Datos II 2
Procesamiento Analítico en Línea

I. INTRODUCCION

El presente trabajo de investigación pretende explicar los conceptos


fundamentales que sustentan al procesamiento analítico en línea (OLAP). Estos
conceptos son abordados de la manera más clara posible, con ejemplos prácticos
que permitirán una rápida comprensión de los mismos.

Para comprender las ventajas de la tecnología OLAP es necesario, primero, hacer


una comparación con el procesamiento transaccional en línea (OLTP), de tal forma
que podamos valorar el alcance de esta tecnología de información.

Entre los principales temas que trataremos se encuentran: datos


multidimensionales, la consolidación, los conceptos de jerarquías, bases de datos
n-dimensionales, seguridad y finalmente el lenguaje de consulta multidimensional
MDSQL.

La principal fuente de información que hemos utilizado es el libro de Bases de


Datos, Diseño, Implementación y Administración de los autores Carlos Coronel,
Steven Morris, Peter Rob, al igual que la fuente del Internet, los sitios web
relacionados con OLAP y SQLServer.

Esperamos que el contenido del trabajo sea lo más completo y a la vez práctico
posible, para que permita una rápida comprensión.

Base de Datos II 3
Procesamiento Analítico en Línea

1. Contenido
1.1. Definición

OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line


Analytical Processing). Es una solución utilizada en el campo de la llamada
Inteligencia de negocios (o Business Intelligence) cuyo objetivo es agilizar la
consulta de grandes cantidades de datos.

Los sistemas OLAP son bases de datos orientadas al procesamiento analítico.


Este análisis suele implicar, generalmente, la lectura de grandes cantidades
de datos para llegar a extraer algún tipo de información útil: tendencias de
ventas, patrones de comportamiento de los consumidores, elaboración de
informes complejos, etc. Este sistema es típico de los datamarts.

 El acceso a los datos suele ser de sólo lectura. La acción más común es la
consulta, con muy pocas inserciones, actualizaciones o eliminaciones.
 Los datos se estructuran según las áreas de negocio, y los formatos de los
datos están integrados de manera uniforme en toda la organización.
 El historial de datos es a largo plazo, normalmente de dos a cinco años.
 Las bases de datos OLAP se suelen alimentar de información procedente
de los sistemas operacionales existentes, mediante un proceso de
extracción, transformación y carga (ETL).
1.2. Arquitectura OLAP

Las características operacionales del OLAP se pueden dividir en tres módulos


principales:

 Interfaz gráfica de usuario(GUI).


 Lógica de procesamiento analítica.
 Lógica de procedimiento de datos.

En el ambiente cliente/servidor, esos tres módulos OLAP hacen posibles las


características de definición del OLAP: Análisis de datos multidimensional,
soporte avanzado para la base de datos y una interfaz fácil de usar.

Base de Datos II 4
Procesamiento Analítico en Línea

Figura 1 Arquitectura Cliente/Servidor de un OLAP

Los sistemas OLAP están diseñados para usar datos de almacén de datos y
operacionales.

Una arquitectura más común y practica es aquella en las que las GUI del OLAP
se ejecutan en estaciones de trabajo clientes, en tanto que la maquina OLAP
o servidor, compuesta de la lógica analítica de procesamiento y lógica OLAP
de procesamiento de datos, se ejecuta en una computadora compartida. En
ese caso, el servidor OLAP será en componente frontal para los datos para
soporte de decisiones del almacén de datos. Este componente frontal o capa
intermedia (porque esta entre el almacén de datos y la GUI) acepta y procesa
las solicitudes de procesamiento de datos generadas por las muchas
herramientas analíticas del usuario final. La GUI de usuario final podría ser un
programa personalizado o, más probablemente, un módulo de conexión que
se integra con software de hojas de cálculo o una herramienta de análisis y
consulta de datos de un tercero.

En casi todas las implementaciones, el almacén de datos y OLAP son


ambientes complementarios, relacionados entre sí. Mientras que el almacén
contiene datos para soporte de decisiones integrados orientados en a temas,

Base de Datos II 5
Procesamiento Analítico en Línea

variantes en el tiempo, y no volátiles, el sistema OLAP proporciona el elemento


frontal por medio del cual los usuarios finales tienes acceso a esos datos y los
analizan. No optante, un sistema OLAP también puede tener acceso
directamente a datos operacionales, transformarlos y guardarlos en una
estructura multidimensional. El sistema OLAP puede proporcionar un
componente alternativo para guardar datos multidimensionales para dar mejor
desempeño, algunos sistemas OLAP fusionan los métodos del almacén y el
mercado de datos al guardar pequeños extractos del almacén en estaciones
de trabajo del usuario final. El objetivo es aumentar la rapidez de acceso y la
visualización de datos (las representaciones graficas de tendencias y
características de los datos) la lógica que hay detrás de ese método es la
suposición de que casi todos los usuarios finales, por el general, trabajan con
subconjunto de datos estables del almacén, más bien pequeños. Por ejemplo,
lo más probable que un analista de ventas trabaje con datos de ventas,
mientras que un representante de cliente lo haga con datos de clientes.

Figura 2 Servidor OLAP con minimercados de datos

Base de Datos II 6
Procesamiento Analítico en Línea

1.3. Características Básicas del OLAP

Características Básicas de cada método se examinan a continuación

1.3.1. OLAP Relacional

El procesamiento analítico en línea relacional (ROLAP): Establece la


funcionalidad OLAP al usar base de datos relacionales y herramienta de
consultas relacionales conocidas para guardar y analizar datos
multidimensionales.

Este método se construye sobre tecnologías relacionales existentes y


representa una extensión natural para todas las compañías que ya se
usan sistemas relacionales de administración de base de datos dentro
de sus organizaciones. El ROLAP agrega las siguientes extensiones a
la tecnología RDBMS tradicional.

 Soporta a esquemas de datos multidimensionales dentro del


RDBMS.
 Lenguaje de acceso de datos y desempeño de consultas
 Soporte para bases de datos muy grandes (VLDB)
 Soporte a esquema de datos multidimensionales dentro del
RDBMS

La tecnología relacional usa tablas normalizadas para guardar datos. La


seguridad en normalización como metodología de diseño para bases de
datos relacionables se ve como un bloque tambaleante para su uso en
sistemas OLAP. La normalización divide entidades de negocios en
partes más pequeñas para producir las tablas normalizadas. Por
ejemplo, los componentes de datos de ventas podrían estar guardados
en cuatro o cinco tablas. La razón para usar las tablas normalizadas es
reducir redundancias, con lo cual se elimina anomalías de datos y se
facilita actualizaciones de datos. Desafortunadamente, para fines de
soporte de decisiones, es más fácil entender datos cuando se ven con
respecto a otros datos. Dada esta vista del ambiente de los datos, este

Base de Datos II 7
Procesamiento Analítico en Línea

informe hemos hecho énfasis en que los datos de soporte de decisiones


tienden hacer no normalizados, duplicados y agregados previamente.
Esas características parecen imposibilitar el uso de técnicas estándar
de diseño relacional y los RDBMS como fundamento para datos
multidimensionales.

Por fortuna para quienes han hecho fuertes inversiones en tecnología


relacional, el ROLAP usa una tecnología especial de diseño para hacer
posible que la tecnología RDBMS soporte representaciones de datos
multidimensionales. Esta técnica especial de diseños se conoce como
esquema en estrella. El cual se estudia en detalle de la imagen 1.

El esquema en estrella está diseñado para optimizar operaciones de


consulta más que de actualización de datos. Naturalmente, cambiar el
fundamento para diseño de datos significa que las herramientas
empleadas para tener acceso a esos datos tendrán que cambiar. Los
usuarios finales familiarizados con las herramientas tradicionales para
consulta relacional descubrirán que esas herramientas no trabajan de
manera eficiente con el nuevo esquema en estrella. No obstante, el
ROLAP salva el día al agregar soporte para el esquema en estrella
cuando se usan herramientas de consulta conocidas. EL ROLAP
proporciona funciones avanzadas para análisis de datos y mejora la
optimización de consultas y los métodos de visualización de datos.

 Lenguaje de acceso a datos y desempeño de consulta


optimizados para datos multidimensionales

Otra crítica de las bases de datos relacionales es que el SQL no está


adaptado para efectuar análisis avanzado de datos. Casi todas las
solicitudes de datos de soporte de decisiones requieren el uso de
consultas de SQL de pasos múltiples o de enunciados SQL anidados
múltiples. Para contestar esta crítica, el ROLAP extiende el SQL para
que pueda distinguir entre requisitos de acceso para datos de almacén
de datos (basados en el esquema en estrella) y datos operacionales

Base de Datos II 8
Procesamiento Analítico en Línea

(tablas normalizadas). En esa forma, el sistema ROLAP es capaz de


generar el código requerido del SQL para tener acceso a los datos del
esquema en estrella.

El desempeño de consultas también se mejora porque el optimizador de


consultas se modifica para identificar los objetivos de consulta buscados
por el código de SQL. Por ejemplo, si el objetivo de consulta es el
almacén de datos, el optimizador le pasa las solicitudes. No obstante, si
el usuario final ejecuta consultas de bajada contra datos operacionales,
el optimizador de consulta identifica es operación y optimiza
correctamente las solicitudes de SQL antes de pasarla por el DBMS
operacional.

Otra fuente de desempeño mejorado de consulta es el uso de técnicas


avanzadas de indización, como los índices de mapas de bits dentro de
bases de datos relacionales. Como su nombre lo sugiere, un índice de
mapa de bits se basa en bits 0 y 1 para representar una condición dada.
Por ejemplo, si el atributo REGION de la figura 13.3 tiene solo cuatro
resultados (Norte, Sur, Este y Oeste), pueden estar representados como
se observa en la Figura 2. (solo los primeros 10 renglones de la figura
13.3 están representados en la Fgura 2. El “1” representa “bit activado”
y el “0” representa “bit desactivado”. Por ejemplo, para representar un
renglón con un atributo REGION = “Este”, solo el bit “Este” estará
activado. Nótese que cada reglón debe estar representado en la tabla
del índice.)

Base de Datos II 9
Procesamiento Analítico en Línea

Tabla 1 Representación de valores en mapa de BITS

REPRESENTACION DE VALORES
DE REGION EN MAPA DE BITS
Norte Sur Este Oeste
0 0 1 0
0 0 1 0
1 0 0 0
1 0 0 0
1 0 0 0
0 1 0 0
0 1 0 0
0 1 0 0
0 0 0 1
0 0 0 1

Nótese que el índice de la tabla anterior toma una cantidad mínima de


espacio. Por tanto, los índices de mapa de bits son más eficientes en el
manejo de grandes cantidades de datos de lo que son los índices que
por lo general se encuentran en muchas bases de datos relacionales.
Pero recuerde que los índices de mapas de bits se usan principalmente
en situaciones donde el número de posibles valores para un atributo (en
otras palabras, el dominio del atributo) es bastante pequeño. Por
ejemplo, REGION tiene solo cuatro resultados en este ejemplo. El
estado civil, es decir, casado, soltero, viudo, divorciado sería otro buen
candidato para índice de mapa de bits. Como lo sería otro buen
candidato para índice de mapa de bits, como lo sería el género: M o F.

Las herramientas ROLAP son principalmente productos


clientes/servidor en las que la interfaz de usuario final, el procesamiento
analítico y el procesamiento de datos tienen lugar en diferentes
computadoras. La imagen 4 muestra la interacción de los componentes
ROLAP cliente/servidor.

Base de Datos II 10
Procesamiento Analítico en Línea

 Soporte para bases de datos muy grandes

Recuerde que el soporte para las VLDB (Base de Datos muy Grandes)
es un requisito de bases de datos para soporte de decisiones. Por tanto,
cuando la base de datos relacional se usa en una función de soporte de
decisiones, también debe ser capaz de guardar cantidades muy grandes
de datos. La capacidad de almacenamiento y el proceso de carga de
datos en la base de datos son de importancia decisiva. Por tanto, el
RDBMS debe tener las herramientas apropiadas para importar, integrar
y poblar el almacén con datos. Los datos para soporte de decisiones se
cargan normalmente en modo a granel (lote) desde los datos
operacionales. No obstante, las operaciones en lote requieren que las
bases de datos fuente y destino se reserven (bloqueen). La velocidad
de las operaciones de carga de datos es importante, en especial cuando
se ve que casi todos los sistemas operacionales funcionan 24 horas al
día, 7 días a la semana, 52 semanas al año. Por tanto, la ventana de
oportunidad para mantenimiento y carga de lotes de abre solo
brevemente, por lo general durante periodos de poca actividad.

Con una arquitectura cliente/servidor abierta, el ROLAP ofrece


funciones avanzadas para soporte de decisiones que son escalables a
toda la compañía. Claramente, el ROLAP es una opción lógica para
compañías que ya usan bases de datos relacionales para sus datos
operacionales. Dado el tamaño del mercado de base de datos
relacionales, no es de sorprender que casi todos los vendedores
actuales de RDBMS hayan extendido sus productos para soportar
almacenes de datos.

1.3.2. OLAP Multidimensional

El procesamiento analítico multidimensional en línea (MOLAP) extiende


la funcionalidad del OLAP a los sistemas de administración de base de
datos multidimensionales (MDBMS). (Un MDBMS usa técnicas
especiales patentadas para guardar datos en arreglos de dimensiones

Base de Datos II 11
Procesamiento Analítico en Línea

n parecidos a matrices.) La premisa del MOLAP es que las bases de


datos multidimensionales están mejor adaptadas para administrar,
guardar y analizar datos multidimensionales. Casi todas las técnicas
patentadas que se usan en los MDBMS se derivan de los campos de la
ingeniería, por ejemplo, el diseño asistió por computadora o la
manufactura asistida por computadora (CAD/CAM) y sistemas de
información geográfica (GIS).

Conceptualmente, los usuarios finales de MDBMS ven los datos


guardados como un cubo tridimensional conocido como cubo de datos.
El lugar de cada valor de datos del cubo es una función de los ejes x, y
y z, en un espacio tridimensional. Esos ejes representan las
dimensiones del valor de los datos. Los cubos de datos pueden crecer
a n número de dimensiones, convirtiéndose así en hipercubos. Los
cubos de datos se crean al extraer datos de las bases de datos
operacionales o del almacén de datos. Una característica importante de
los cubos es que son estáticos; esto es, no están sujetos a cambios y
deben ser creados y deben ser creados antes de que se puedan usar.
Los cubos de datos no pueden ser creados por consultas ad hoc. En
cambio, se pueden se pueden consultar cubos creados previamente con
ejes definidos; por ejemplo, un cubo para ventas tendrá dimensiones de
producto, de lugar y de tiempo y se pueden consultar solo esas
dimensiones. Por tanto, el proceso de creación del cubo es crítico y
requiere trabajo de diseño a fondo del elemento frontal. El trabajo de
diseño del elemento frontal puede estar bien justificado por que se sabe
que las bases de datos MOLAP son mucho más rápidas que sus
similares ROLAP, en especial cuando se trata con conjuntos de datos
de tamaño pequeño a mediano. Para acelerar el acceso a los datos, los
cubos se mantienen en memoria en lo que se denomina cache de cubo.
(un cubo de datos es solo una ventana para un subconjunto predefinido
de datos de la base de datos. Un cubo de datos y una base de datos no

Base de Datos II 12
Procesamiento Analítico en Línea

son lo mismo.) Como el MOLAP, en el cliente MOLAP, o en ambos


lugares. La Figura 4 muestra la arquitectura básica del MOLAP.

Cuando el cubo de datos esta predefinido con un número establecido


de dimensiones, la adición de una nueva dimensión requiere que todo
el cubo sea recreado. Este proceso de recreación es lento. Por tanto,
cuando cubos de datos sean creados con demasiada frecuencia, el
MDBMS pierde parte de su ventaja en velocidad sobre la base de datos
relacional. Y aunque los MDBMS tengan ventajas de operación sobre
las bases de datos relacionales, están mejor adaptadas para conjuntos
de tamaño mediano y pequeño. La escalabilidad es un tanto limitada por
que le tamaño del cubo de datos está restringido para evitar largos
tiempos de acceso a datos causados por tener menos espacio de
trabajo (memoria) disponible para el sistema operativo y los programas
de aplicación. Además, el MDBMS hace uso de técnicas patentadas de
almacenamiento de datos que, a su vez, requieren métodos patentados
de acceso a los datos que usan un lenguaje de consulta
multidimensional.

El análisis de datos multidimensional también es afectado por la forma


en que el sistema de base de datos maneja la dispersión. La dispersión
es una medida de la densidad de los datos contenidos en el cubo de
datos; se calculan al dividir el número total de valores reales en el cubo
entre el número total de celdas en él. Debido a que las dimensiones del
cubo están predefinidas, no todas las celdas están pobladas, algunas
están vacías. Regresando al ejemplo de ventas, puede haber muchos
productos que no se venden durante el lapso determinado en un lugar
dado. De hecho, con frecuencia se encontrará menos de 50% de las
celdas del cubo de datos están pobladas. En cualquier caso, las bases
de datos multidimensionales deben manejar con eficiencia la dispersión
para reducir de manera eficiente el procesamiento de los gastos
generales y las necesidades de recursos.

Base de Datos II 13
Procesamiento Analítico en Línea

Ilustración 3 Arquitectura cliente/servidor MOLAP

Los proponentes relacionales también alegan que usar soluciones


patentadas hace difícil integrar el MDBMS con otras fuentes de datos y
herramientas que usan dentro de la empresa. Aunque se requiere
considerable inversión de tiempo y trabajo para integrar la nueva
tecnología y la arquitectura existente de sistemas de información, el
MOLAP puede ser una buena solución para esas situaciones en las que
las bases de datos de tamaño pequeño a mediano son la noma y la
velocidad del software de aplicación es crítica.

1.3.3. OLAP Dimensional vs. OLAP Multidimensional.

La tabla 5 resume algunas de las pro y contras del ROLAP y MOLAP.


Recuerde, también, que la selección de uno u otro con frecuencia
depende del punto de vista del evaluador. Por ejemplo, una evaluación
apropiada del ROLAP debe incluir precio, plataformas de hardware
soportadas, compatibilidad con los DBMS existentes, requisitos de

Base de Datos II 14
Procesamiento Analítico en Línea

programación, desempeño y disponibilidad de herramientas


administrativas. El resumen de la tabla 13.10 es un útil punto de partida
para la comparación.

Tabla 2 OLAP Relacional vs OLAP multidimensional

OLAP relacional vs. OLAP multidimensional


CARACTERISTICAS ROLAP MOLAP
Esquema Esquema es estrella Usa cubos de datos
Dimensiones Dimensiones
adicionales se pueden adicionales requieren
agregar recreación de cubo de
dinámicamente datos
Tamaño de la base de Mediano a Grande Pequeño a mediano
datos
Arquitectura Cliente/servidor Cliente/servidor
Basada en estándares Patentada
Abierta
Acceso Soporta peticiones ad Limitado a
hoc dimensiones
Dimensiones limitadas predefinidas
Recursos Altos Muy altos
Flexibilidad Alta Baja
Escalabilidad Alta Baja
Velocidad Buena con conjuntos Más rápida para
de datos pequeños; conjuntos de datos
promedio para de pequeños a
conjuntos de datos de medianos; promedio
tamaño medio a para conjuntos de
grande datos grandes

Base de Datos II 15
Procesamiento Analítico en Línea

Los vendedores de ROLAP y MOLAP están trabajando hacia la


integración de sus respectivas soluciones dentro de un marco unificado
de soporte de decisiones. Muchos productos OLAP pueden manejar
datos tabulares y multidimensionales con la misma facilidad. Por
ejemplo, si usted está usando funcionalidad OLAP en Exel, como se ve
en la Figura 6, puede tener acceso a datos relacionales OLAP en un
servidor de SQL, así como a cubo de datos (multidimensional) en la
computadora local. Mientras tanto, las bases de datos relacionales
exitosas usan el diseño de esquema en estrella para manejar datos
multidimensionales y su participación de mercado hace poco probable
que su popularidad se reduzca en el corto plazo.

Figura 4 Integración de OLAP con un programa de hoja de cálculo

1.4. Extensiones de SQL para OLAP


La proliferación de herramientas de procesamiento analítico en línea (OLAP)
ha fomentado el desarrollo de extensiones de SQL, para dar soporte al análisis
de datos multidimensional. Casi todas las innovaciones de SQL, son el
resultado de mejoras de productos centradas en vendedores. No obstante,
muchas de ellas se han abierto paso en el SQL estándar. Haremos algunas

Base de Datos II 16
Procesamiento Analítico en Línea

introducciones a las nuevas de SQL que han sido creados para soportar
manipulaciones de base de datos OLAP.

Figura 5 Esquema de Copo de Nieve

1.4.1. La Extensión ROLLUP


La extensión ROLLUP es usada con la cláusula GROUP BY para
generar agregados por diferentes dimensiones. Como usted sabe, la
cláusula GROUP BY genera solo un agregado por cada nueva
combinación de atributos de valor citados en la cláusula GROUP BY. L
extensión ROLLUP avanza un paso más; hace posible que el usuario
obtenga un subtotal por cada columna citada excepto por la ultima, que
obtiene en cambio un gran total. La sintaxis de la GROUP BY ROLLUP
es como sigue:

SELECT columna 1, columna 2|,…|. función de agregado (expresión)

FROM tabla1 [, tabla2, …]

[WHERE condición]

GROUP BY ROLLUP (columna1, columna2 [, …])

[HAVING condición]

{ORDER BY columna1 [columna2, …]}

El orden de la lista de columnas dentro del GROUP BY ROLLUP es


muy importante. La última columna genera un gran total. Todas las otras

Base de Datos II 17
Procesamiento Analítico en Línea

columnas generan subtotales. Por ejemplo, la figura 13.25 muestra el


uso de la extensión ROLLUP para generar subtotales por vendedor y
producto.

Figura 6 Extensión ROLLUP

1.4.2. La Extensión Cube


La extensión Cube también se usa con la cláusula GROP BY para
generar agregados para las columnas citadas en la expresión, además
de un gran total por la última columna citada. La sintaxis del GRUP BY
es como sigue:

SELECT columna 1, columna 2|,…|. función de agregado (expresión)

FROM tabla1 [, tabla2, …]

[WHERE condición]

Base de Datos II 18
Procesamiento Analítico en Línea

GROUP BY ROLLUP (columna1, columna2 [, …])

[HAVING condición]

{ORDER BY columna1 [columna2, …]}

Por ejemplo, la Figura 9 muestra el uso de la extensión CUBE, para


calcular los subtotales de ventas por mes y por producto

Figura 7 Extensión CUBE

1.4.3. Vistas Materializadas

El almacén de datos normalmente contiene tablas de hechos que


guardan mediciones específicas de interés para una organización. Esas
mediciones son organizadas por diferentes dimensiones. La mayoría de
análisis de negocios OLAP de “actividades diarias” está basada en
comparaciones de datos que son agregados en diferentes niveles; por
ejemplo, totales por vendedor, producto y tienda.

Base de Datos II 19
Procesamiento Analítico en Línea

Debido a que normalmente los negocios usan un conjunto


predeterminado de resúmenes como referencia, es razonable
predefinirlos para su uso futuro al crear tablas de hechos, en resumen,
una exposición de técnicas adicionales para mejorar el desempeño, Sin
embargo, la creación de múltiples tablas de hechos en resumen que
usan consultas GROUP BY con múltiples combinaciones de tabla podría
convertirse en una operación intensiva de recursos. A demás, los
almacenes de datos también deben ser capaces de mantener datos
resumidos actualizados en todo momento. Entonces, ¿qué pasa con las
tablas de hechos en resumen después que nuevos datos de ventas se
hayan agregado a las tablas de hechos de datos? Bajo circunstancias
normales, las tablas de hechos en resumen son recreadas. Esta
operación requiere que el código de SQL se ejecute otra vez para volver
a crear todos los renglones de resumen, incluso cuando solo unos pocos
renglones necesitan ser actualizados. Es evidente que este es u
proceso lento.

Para ahorrar tiempo de procesamiento de consulta, la mayoría de los


vendedores de bases de datos han implementado “funcionalidad”
adicional para manejar con más eficiencia resúmenes agregados. Esta
nueva funcionalidad se asemeja a las vistas de SQL estándar para las
cuales el código de SQL esta predefinido en la base de datos. No
obstante, la diferencia de funcionalidad es que las vistas guardan los
renglones agregados previamente, algo así como una tabla, en
resumen. Por ejemplo, Microsoft SQL Server contiene vistas indizadas,
mientras que Oracle contiene vistas materializadas. Esta sección
explica el uso de las vistas materializadas.

Una vista materializada es una tabla dinámica que no solo contienen el


comando de consulta SQL para generar los renglones, sino que también
guarda los renglones reales. La vista materializada se crea la primera
vez que la consulta se ejecuta y los renglones de resumen se guarda en

Base de Datos II 20
Procesamiento Analítico en Línea

la tabla. Los renglones de la vista materializada se actualizan


automáticamente cuando se actualizan las tablas de base. En esta
forma, el administrador del almacén de datos creará la vista, pero no
tendrá que preocuparse por actualizarla. El uso de vista materializadas
es totalmente transparente para optimización de consulta del BBMS
automáticamente usará las vistas materializadas si dan mejor
operación. La sintaxis básica para la vista materializada es:

CREATE MATERIALIZED VIEW nombre_ de_vista

BUILD {IMMEDIATE | DEFERRED}

REFRESH {[FAST | COMPLETE | FORCE]} ON COMMIT

[ENABLE QUERY REWRITE]

As select_consulta;

La cláusula BUILD indica cuando los renglones de vista materializada


estén poblados en realidad. IMMEDIATE indica que los renglones de
vista materializada queden poblados inmediatamente después en
introducir el comando. DEFERRED indica que los renglones de vista
materializada quedarán poblados después. Hasta entonces, la vista
materializada está en un estado “no utilizable”. El DBMS contiene una
rutina especial que un administrador ejecuta para poblar vistas
materializadas.

La cláusula REFRESH permite que usted indique cuando y como


actualizar la vista materializada cuando se agreguen nuevos renglones
a las tablas de base. FAST indica que siempre que se haga un cambio
en esas tablas, la vista materializada actualiza solo los renglones
afectados. COMPLETE indica que una actualización completa se hará
para todos los renglones de la vista materializada cuando se ejecuta de
nuevo la consulta de selección en la que está basada la lista. FORCE
indica que el DBMS primero tratará de hacer una actualización FAST;
de otro modo, hará una actualización COMPLETE. La cláusula ON
Base de Datos II 21
Procesamiento Analítico en Línea

COMMIT indica que las actualizaciones a la vista materializada tendrán


lugar como parte del proceso de confirmación del enunciado
fundamental del DML, esto es, como parte de la confirmación de la
transacción de DML que actualizó las tablas de base. La opción
ENABLE QUERY REWRITE permite que el DBMS use las vistas
materializadas en optimizaciones de consulta.

Para crear vistas materializadas, se deben haber especificado


privilegios y completar pasos específicos indispensables. Como
siempre, se deben recurrir a la documentación del DBMS para las
últimas actualizaciones. En el caso de Oracle, se deben crear bitácoras
de vista materializada en las tablas de base de ésta.

Figura 8 Creación de una vista materializada

Base de Datos II 22
Procesamiento Analítico en Línea

La vista materializada calcula el total de unidades mensuales vendidas


y los agregados del total de ventas por producto. La vista materializada
SALES_MONTH_MV está configurada para actualizarse
automáticamente después de cada cambio en las tablas de base.
Nótese que el ultimo renglón SALE_MONTH_MV indica que durante
octubre; las ventas del producto ´WR3/TT3’ son tres unidades, para un
total de $359.85. La figura 13.28 muestra los efectos de una
actualización ala tabla de base DWDAYSALESFACT.

Figura 9 Actualización de una vista materializada

Muestra la forma en que la vista materializada se actualizo


automáticamente después de la inserción de un nuevo renglón en la
tabla DWDAYSALESFACT. Nótese que el ultimo renglón de

Base de Datos II 23
Procesamiento Analítico en Línea

SALES_MONTH_MV ahora muestra que, en octubre, las ventas del


producto ‘WRE/TT3’ fueron de cuatro unidades, para un total de
$466.84.

Aunque todos los ejemplos de esta sección se concentran en


extensiones de SQL para soportar la generación de informes de OLAP
en un DBMS de Oracle, hemos visto solo una pequeña parte de las
numerosas funciones de inteligencia de negocios que actualmente
suministran casi todos los vendedores de DBMS. Por Ejemplo, casi
todos suministran espléndidas interfaces gráficas de usuario para
manipular, analizar, y presentar los datos en múltiples formatos. En la
siguiente figura muestra ambos productos de OLAP: uno de Oracle y
otro de Microsoft.

Ilustración 10 Muestras de aplicaciones OLAP

Base de Datos II 24
Procesamiento Analítico en Línea

1.5. Ejemplo
Ejemplo con SQL y Excel
Paso 1. Creamos una base de Datos en SQL Server y llenamos
registros a cada tabla creada:

Base de
Datos
Seleccionad

Figura 11 Creación de la BD

En nuestro caso hemos creado la base bdRemza sobre la cual actuaremos.


Paso 2. Abrimos la aplicación Excel

Figura 12 Icono de Excel

Paso 3. Seleccionamos la cela A1

Figura 13 Selección de celda

Base de Datos II 25
Procesamiento Analítico en Línea

Paso 4. Vamos a la cinta Datos

Figura 14 Cinta Datos

Paso 5. Seleccionamos la Opción de Obtener datos externos

Figura 15 Obtener datos

Paso 6. Seleccionamos desde otras fuentes.

Figura 16 Desde fuente de datos

Paso 7. Seleccionamos Desde el asistente para la conexión de datos

Figura 17 Desde asistente

Base de Datos II 26
Procesamiento Analítico en Línea

Paso 8. Seleccionamos Otro avanzado

Figura 18 Asistente de conexion de datos I

Damos clic al botón siguiente


Paso 9. Seleccionamos Microsoft OLE DB Provider for SQL Server

Figura 19 Propiedades de conexión

Damos clic en Aceptar

Base de Datos II 27
Procesamiento Analítico en Línea

Paso 10. Aparecerá una ventana en en donde iniciaremos sesión con


SQL.

Figura 20 Inicio de Sesión

Click en Aceptar
Paso 11. Nos aparece la ventana de Asistente para la conexión de datos.

Seleccionamos
la BD bdRemza

Figura 21 Asistente de conexión de datos I

Seleccionamos la tabla para ver sus datos y damos clic en siguiente


Paso 12. Aparece la una ventana para Guardar archivos de conexión de
datos y finalizar

Base de Datos II 28
Procesamiento Analítico en Línea

Figura 22 Terminar la conexión

Damos clic en Finalizar


Paso 13. Nos sale una ventana Importar datos

Figura 23 Importando datos

Seleccionamos tabla dinámica y le damos clic en aceptar.

Base de Datos II 29
Procesamiento Analítico en Línea

Paso 14. Nos aparecerá lo siguiente en la cual actuaremos

Figura 24 Muestra de datos

Arrastremos los datos a los cuadros que tenemos en la parte derecha de la


hoja que sirve para organizar la información y pues mostraremos datos más
ordenados

Base de Datos II 30
Procesamiento Analítico en Línea

Paso 15. Obtenemos el siguiente resultado

Figura 25 Muestra de datos

Paso 16. Le damos clic en más Tablas

Figura 26 Agregar más tablas

Base de Datos II 31
Procesamiento Analítico en Línea

Se generarán más hojas nuevas y seleccionamos las tablas principales con


las que se relacionan las bases de datos, al final nos mostrará un reporte de
la siguiente manera

Figura 27 Resultado Final

2. Resumen

OLAP cuyas Siglas significan Procesamiento Analítico en línea su objetivo es


agilizar la consulta de grandes cantidades de datos, y es útil para extraer
información importante; como la tendencia de ventas, patrones de comportamiento
de los consumidores, elaboración de informes complejos, etc.

Las características operacionales del OLAP se pueden dividir en tres módulos


principales:

 Interfaz gráfica de usuario(GUI).


 Lógica de procesamiento analítica.
 Lógica de procedimiento de datos.

Las características básicas del OLAP son las siguientes:

Base de Datos II 32
Procesamiento Analítico en Línea

 OLAP Relacional:

El ROLAP agrega las siguientes extensiones a la tecnología RDBMS


(Sistema Gestor de Bases de Datos Relacionales) tradicional.

 Soporta a esquemas de datos multidimensionales dentro del RDBMS.


 Lenguaje de acceso de datos y desempeño de consultas.
 Soporte para bases de datos muy grandes (VLDB)
 OLAP Multidimensional

Bases de datos multidimensionales están mejor adaptadas para administrar,


guardar y analizar datos multidimensionales.

3. Summary
OLAP whose acronym stands for Online Analytical Processing are charged with
the goal of expediting the query of large amounts of data, it is useful to extract
important information; such as the sales trend, patterns of consumer behavior,
elaboration of complex reports, etc.
The operational characteristics of the OLAP can be divided into three main
modules:
 Graphical user interface (GUI).
 Logic of analytical processing.
 Data procedure logic.
The basic characteristics of OLAP are the following:
 OLAP Relational:
The ROLAP adds the following extensions to traditional RDBMS technology.
 Supports multidimensional data schema within the RDBMS.
 Data access language and query performance.
 Support for very large databases (VLDB)
 OLAP Multidimensional

Multidimensional data bases are better adapted to manage, save and


analyze multidimensional data.

Base de Datos II 33
Procesamiento Analítico en Línea

4. Recomendaciones.
 Es recomendable usar el OLAP cuando se tienen grandes cantidades de
datos para poder utilizar las múltiples consultas.
 Es importante usar el OLAP en empresas para la gestión eficaz de
información.
 Es importante utilizar cubos para visualizar las transacciones o procesos de
múltiples vistas.
 El OLAP se puede aplicar tanto en herramientas como Excel, visual, etc. para
esto es necesario no olvidarse del usuario y/o contraseña de las bases de
datos con las que actuaremos.
 Se recomienda que para la conexión con ORACLE se debe iniciar con el
usuario que le agregamos al momento de instalarlo.
5. Conclusiones
 Concluimos que OLAP es una herramienta eficaz para la gestión de consultas
de múltiples datos, gracias a la utilización de los cubos OLAP que lo podemos
ver de múltiples dimensiones
 La data warehouse OLAP es una herramienta que nos abre la puerta a la
competitividad, optimiza tiempo y dinero. Nos permite tener una toma de
decisiones, con fundamentos sólidos, positiva para la organización y
productiva y sobre todo facilita la comprensión de cantidades grandes de
información fáciles de consultar.
 Nos permite ir al análisis directo y trabajar bajo un modelo multidimensional
y dinámico.
 El procedimiento multidimensional nos permite explorar el comportamiento
de varias variables de escala a través de estadísticos de resumen, los cuales
son expresados de acuerdo a una combinación específica de categorías de
múltiples variables categóricas.
 La utilidad del modelo multidimensional, radica en la posibilidad de apreciar
el comportamiento de los datos a medida que se definen nuevas
combinaciones de categorías, permitiéndonos observar aspectos específicos
de la información como la edad o los ingresos de las mujeres casadas.

Base de Datos II 34
Procesamiento Analítico en Línea

Adicionalmente, el programa nos permite realizar comparaciones


porcentuales o aritméticas entre las variables de escala o inclusive entre las
categorías de una variable categórica.
 Definitivamente fundamentar todas las decisiones no estructuradas,
presentes en los niveles táctico (gerencia media) y estratégico (alta
gerencia), sobre la base de un conocimiento preciso y elaborado, con el uso
de herramientas y técnicas evolucionadas y tecnológicas, destinadas para el
efecto, y basados en el modelo de los sistemas OLAP vamos a tener
organizaciones que tendrán información histórica que les ayudará a la toma
de decisiones proyectados al futuro y orientados a una mejor toma de
decisiones.
6. Apreciación Del Equipo
 Proceso Analítico en Línea(OLAP) viene hacer una solución para el análisis
de datos en diferentes aspectos como son: OLAP en IES (alertas, toma de
decisiones), OLAP en la Actividad Financiera (reportes analíticos,
Planeamiento, Análisis), OLAP en el Marketing (análisis de productos,
clientes, facturación) en todo esto cuyo objetivo es agilizar la consulta de
grandes cantidades de datos. Para ello utiliza estructuras de datos diversas,
normalmente multidimensionales (o Cubos OLAP), que contienen datos
resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP).
 En mi opinión el OLAP es muy importante para utilizar en la Inteligencia de
Negocios; ya que entenderemos mejor una consulta de orígenes de datos
antiguos, es más rápido a la hora de ejecutar sentencias SQL de tipo
SELECT, en contraposición con OLTP que es la mejor opción para
operaciones de tipo INSERT, UPDATE Y DELETE, Está herramienta OLAP
nos mostrará datos estadísticos que nos ayudará para tomar buenas de
decisiones; al hablar de que nos ayudará en el proceso de toma de
decisiones, nos referimos a que OLAP es una herramienta de administración.
7. Glosario De Términos
 Datamart OLAP

Base de Datos II 35
Procesamiento Analítico en Línea

Se basan en los populares cubos OLAP, que se construyen agregando, según los
requisitos de cada área o departamento, las dimensiones y los indicadores
necesarios de cada cubo relacional. El modo de creación, explotación y
mantenimiento de los cubos OLAP es muy heterogéneo, en función de la
herramienta final que se utilice.
 Cube o Cubo
En líneas generales, se llama Cube a la estructura de datos multidimensional que
representa la intersección de una combinación única de dimensiones. Para cada
intersección hay una celda que contiene un valor.
 BENCHMARK
Se trata de un tipo de medida que es utilizada para llevar a cabo comparaciones,
siendo una de las más frecuentes la contrapartida precio-ganancia.
 WORDKFLOW
Su traducción al español es flujo de trabajo, y precisamente se refiere a los
volúmenes de información referidos al flujo de trabajo en la empresa, es decir que
engloba a las herramientas que permiten el flujo de documentos entre los usuarios,
para de esta forma poder llevar a cabo los procesos propios del negocio.
 FORECASTING
Se trata de los pronósticos que se pueden obtener del análisis de la información
contenida en las bases de datos de la empresa, un aspecto más que importante
para poder tomar decisiones correctas a futuro.
 MODELING O MODELADO
Este término se refiere básicamente a las distintas acciones que tienen lugar para
poder representar en un modelo el funcionamiento de una empresa, con el objetivo
de que pueda ser utilizado para simular el mundo real y el desempeño de la
organización dentro de este. Es por ello que en la actualidad los analistas,
planificadores y ejecutivos de las compañías suelen utilizar el Modeling a menudo,
ya que les permite a través de la simulación, llevar a cabo un análisis concreto
sobre las realidades operacionales y financieras de la empresa, con lo cual se
vuelve una herramienta imprescindible para la toma de decisiones.

Base de Datos II 36
Procesamiento Analítico en Línea

 MULTIDIMENSIONAL ONLINE ANALYTICAL PROCESSING (MOLAP O


MOLA)
Se trata de una base de datos del tipo OLAP Multidimensional, dentro de la cual
la información es almacenada en estructuras especiales, para luego ser
transferidas a servidor central.
 ONLINE ANALYTICAL PROCESSING (OLAP)
En su traducción al español significa Procesamiento Analítico Online, y consiste
en un tipo de herramientas de software que brinda acceso rápido y sencillo a todos
los datos que puedan llegar a necesitar los analistas, administradores y ejecutivos
de una organización. Esto se realiza a través de una interfaz amigable que
concentra datos corporativos, incluyendo datos históricos y proyecciones. Dentro
del universo OLAP se congregan distintas aplicaciones destinadas a las diferentes
áreas de la empresa. Cabe destacar que los sistemas OLAP trabajan a través de
técnicas especializadas de indexación y optimización de datos, con el fin de poder
estructurar bases multidimensionales de información, y así poder manejar grandes
volúmenes de datos de forma rápida y sencilla.
 ONLINE TRANSACTION PROCESSING (OLTP)
Como su nombre lo indica, se refiere al procesamiento de las transacciones en
línea, es decir que se trata de un sistema que permite procesar las transacciones
apenas son ingresadas al mismo, con lo cual es posible actualizar de manera
inmediata los archivos que se encuentran dentro del sistema de administración de
bases de datos. Por lo general suele ser muy utilizado en el ámbito del seguimiento
de inventarios.
 OPERATIONAL SYSTEM O SISTEMA OPERACIONAL
Es un sistema de información cuya función se centra en el registro de las
transacciones diarias de negocio, las cuales se encuentran categorizadas de
acuerdo a determinados eventos, procesos o actividades propias del negocio.
 BUDGETING O PLANIFICACIÓN PRESUPUESTARIA
Se refiere al proceso de realización de un presupuesto anual en el que se basa el
plan operativo de la compañía.
 RELATIONAL DATABASE MANAGEMENT SYSTEM (RDBMS)

Base de Datos II 37
Procesamiento Analítico en Línea

Denominada en español como Sistema Gestor de Bases de Datos Relacionales,


consiste en un conjunto de programas, procedimientos y lenguajes que brindan
acceso a diferentes herramientas que son necesarias para poder trabajar con una
base de datos.
 RELATIONAL ONLINE ANALYTICAL PROCESSING (ROLAP)
La llamada base de datos ROLAP es a grandes rasgos un modo de
almacenamiento OLAP, en el cual los datos son almacenados en bases de datos
relacionales.
 RETURN ON INVESTMENT (ROI)
Las conocidas siglas ROI en el mundo empresarial, que se refieren al retorno de
la inversión, consiste en el lapso de tiempo que demora en que el coste total de la
inversión se superado por el beneficio o el recorte de gastos derivados
directamente de dicha inversión.
 TRANSACTIONAL SYSTEM O SISTEMA TRANSACCIONAL
Se trata del sistema que ha sido creado y diseñado para almacenar información
empresarial de manera diaria, por lo cual esta información suele estar
categorizada de acuerdo a su relación con eventos, procesos o actividades de
negocio. Si bien este tipo de sistemas no permite el análisis de la información
almacenada, lo cierto es que brindan la posibilidad de almacenar grandes
volúmenes de datos.
8. Bibliografía o Linkografía

https://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx

https://www.youtube.com/watch?v=3ul5KiSyzKo

https://www.iniciativasempresariales.com/admin/img/Business_intelligence_Big_
Data.pdf

https://www.codeproject.com/Articles/658912/Create-First-OLAP-Cube-in-SQL-
Server-Analysis-Serv

https://www.sqlshack.com/es/caracteristicas-de-sql-server-business-intelligence-
creando-un-simple-cubo-olap/

Base de Datos II 38
Procesamiento Analítico en Línea

https://books.google.com.pe/books?id=KlNC0Gc_RREC&printsec=frontcover&dq
=libro+de+base+de+datos+carlos+coronel&hl=es-
419&sa=X&ved=0ahUKEwju8oH8yeHbAhUyqlkKHSUzCrwQ6AEILDAB#v=onepa
ge&q=libro%20de%20base%20de%20datos%20carlos%20coronel&f=false

Base de Datos II 39

Você também pode gostar