Escolar Documentos
Profissional Documentos
Cultura Documentos
LA SELVA
FACULTAD DE INGENIERIA EN INFORMATICA Y SISTEMAS
CHUCOS
BAQUERIZO
de mercado se habra sabido con anticipacin hacia donde dirigir los esfuerzos de
la publicidad con dos resultados benficos: en primer lugar, la publicidad no
habra sido inefectiva y el dinero utilizado en las campaas no se habra
desperdiciado; y en segundo lugar, se habra atendido a los verdaderos clientes
potenciales, con lo cual las ventas habran sido mayores. El ejemplo es hipottico,
pero la situacin es muy similar a la cotidianeidad, muchas empresas utilizan el
sentido comn y la intuicin para tomar decisiones, la informacin que se traduce
en conocimientos acerca la visin interna a la realidad y esa diferencia existente
es la que puede representar miles o millones de pesos. Lo que se pretende es
acercar el mundo real a la visin interna para generar ganancias, para convertir la
informacin en utilidades, para darle un valor a la informacin.
Si la informacin es un activo, debemos poder asignarle un valor en pesos. La
pregunta que surge inmediatamente es cmo podemos asignarle un valor
en pesos a la informacin. Dado un mercado libre, la primera respuesta es
que el valor de la informacin es lo que en el mercado se pague por ella. Este
recurso simple, basado en el valor percibido, muchas veces es suficiente para
asignarle
un valor a la informacin, sin embargo, no es suficiente en otros casos,
por ejemplo, en el caso de una pieza de informacin que no vende y que es
utilizada nicamente en procesos internos de toma de decisiones.
La importancia de una buena informacin puede ser vista como la diferencia
en valor entre una decisin correcta y una decisin equivocada, en donde
la decisin est basada en esa informacin. Mientras ms grande sea esa
diferencia entre decisin correcta y errnea, mayor ser la importancia de
contar con una buena informacin [Bitam, 2002].
Informacin Tctica
Informacin que soporta la coordinacin de actividades y el plano operativo de
la estrategia, es decir, se plantean opciones y caminos posibles para alcanzar la
estrategia indicada por la direccin de la empresa. Se facilita la
Sistemas de Informacion Gerencial - FIIS - UNAS
Objetivos de la informacin
El objetivo del usuario operativo es que se le facilite y automatice la operacin
de una funcin especfica de la empresa; el de un estratega es maximizar la
funcin de la empresa.
Usuarios
3
Puede considerarse que el modelo relacional en el cual se basa OLTP Procesamiento Transaccional en Lnea (OnLine Transational Procesing,
en ingles), tiene como objetivo mantener la integridad de la informacin
(relaciones entre los datos) necesaria para operar un negocio de la manera ms
eficiente. Sin embargo, este modelo no corresponde a la forma como el
usuario percibe la operacin de un negocio.
Sistemas de Informacion Gerencial - FIIS - UNAS
Basados en Datawarehouse
Basados en Datawarehouse
integracin principalmente.
4. Carga de Datos: insercin sistemtica de datos en el componente de
almacenamiento fsico DW.
5. Datawarehouse: almacenamiento fsico de datos de la arquitectura DW.
6. Herramientas de Acceso al componente de almacenamiento fsico
DW: herramientas que proveen acceso a los datos.Estas
herramientas
pueden ser herramientas
especficas
demercado
para
visualizacin de bases multidimensionales almacenadas en
datawarehouses como tambin aplicaciones desarrolladas dentro de la
organizacin del tipo EIS/DSS .
La figura 2-1 muestra la estructura bsica:
BD
Operacional
Datos
Externos
Extracin de Datos
T ransformacin
Aplicaciones
EIS/DSS
Carga de
Datos
Data
Warehouse
Acceso a
Datos
Usuarios
Data
Warehouse
Usuarios Area 1
DataMart 1
Usuarios Area 2
DataMart 2
Data
Warehouse
Usuarios Area n
DataMart N
Usuarios Area 1
DataMart 1
Usuarios Area 2
DataMart 2
Data
Warehouse
Usuarios Area n
DataMart N
Soporte al Datawarehouse
Soporte OLAP,
Soporte de Data Mining y
Soporte al EIS/DSS (deben incluir OLAP y Data Mining) y acceso a
datos.
En los apartados 2.3, 2.4 y 2.5 se detallan los conceptos de OLAP, Data
Mining y EIS/DSS.
2.2.3.2. Costos de Operacin
Una vez que est construido y entregado un DW debe ser mantenido y
actualizado para que tenga valor empresarial. Son justamente estas actividades
de mantenimiento y actualizacin, la fuente de continuos costos operacionales
para un DW. Se pueden distinguir tres tipos de costos de operacin
[Sperley,1999]:
Evolutivos: ajustes continuos del DW a travs del tiempo, como cambios
de expectativas y cambios producto del aprendizaje de los RRHH del
Valor
401%
322%
533%
160%
2.3 Aos
Compartida:
implementa
los
requerimientos
de
seguridad
necesarios para compartir datos potencialmente confidenciales a travs
de una gran poblacin de usuarios.
Fecha
1Qtr
2Qtr
3Qtr
suma
4Qtr
TV
U.S.A
PC
VCR
suma
Pais
Canada
Mexico
suma
suma total
Figura 2-5. Cubo con tres dimensiones.
Operaciones de Usuario
La funcionalidad de los sistemas OLAP se caracteriza por ser un
anlisis multidimensional de datos corporativos, que soportan los anlisis del
usuario y unas posibilidades de navegacin, seleccionando la informacin a
obtener.
Usuarios
BD
BD
BD
Extracin
Transformacin
Carga
OLAP
BD
Data
Warehouse
Tabla
Dimensin
Tabla
Dimensin
Tabla de
Hechos
Tabla
Dimensin
Tabla
Dimensin
Tabla
Dimensin
Tabla
Dimensin
Tabla
Dimensin
Tabla de
Hechos
Tabla
Dimensin
Tabla
Dimensin
Tabla
Dimensin
Cliente
Clav e_Cliente
Nombre
Direccion
Telef ono
Fecha
Ventas
Vendedor
Clav e_Fecha
Dia
Semana
Mes
Trimestre
Ao
Clav e_Cliente
Clav e_Fecha
Clav e_Vendedor
Clav e_Producto
Cantidad_Vendida
Monto_Venta
Clav e_Vendedor
Nombre
Direccion
Telef ono
Producto
Clav e_Producto
Descripcion
Categoria
Simplifica la navegacin.
Cliente_DatosAdicionale
s
Clave_datosadicionales
EstudiosUnivesitarios
CantHijos
CantTarjetasCredito
Cliente
Clave_Cliente
Nombre
Direccion
Telefono
clave_datosadicionales
Fecha
Ventas
Vendedor
Clave_Fecha
Dia
Semana
Mes
Trimestre
Ao
Clave_Cliente
Clave_Fecha
Clave_Vendedor
Clave_Producto
Cantidad_Vendida
Monto_Venta
Clave_Vendedor
Nombre
Direccion
Telefono
Producto
Clave_Producto
Descripcion
Clave_categoria
Categoria
Clave_categoria
Descripcion
Sistemas MOLAP
La arquitectura MOLAP usa unas bases de datos multidimensionales
para proporcionar el anlisis, su principal premisa es que el OLAP
est mejor implantado almacenando los datos multidimensionalmente. Por el
contrario, la arquitectura ROLAP cree que las capacidades OLAP estn
perfectamente implantadas sobre bases de datos relacionales
Un sistema MOLAP usa una base de datos propietaria multidimensional, en la
que la informacin se almacena multidimensionalmente, para ser visualizada en
varias dimensiones de anlisis.
El sistema MOLAP utiliza una arquitectura de dos niveles: la bases de datos
multidimensionales y el motor analtico.
La base de datos multidimensional es la encargada del manejo, acceso y
obtencin del dato.
El nivel de aplicacin es el responsable de la ejecucin de los requerimientos
OLAP. El nivel de presentacin se integra con el de aplicacin y proporciona un
interfaz a travs del cual los usuarios finales visualizan los anlisis OLAP.
Una arquitectura cliente/servidor permite a varios usuarios acceder a la misma
base de datos multidimensional.
La informacin procedente de los sistemas operacionales, se carga en el
sistema MOLAP, mediante una serie de rutinas por lotes. Una vez cargado el dato
elemental en la Base de Datos multidimensional (MDDB), se realizan una serie de
clculos por lotes, para calcular los datos agregados, a travs de las dimensiones
de negocio, rellenando la estructura MDDB.
Tras rellenar esta estructura, se generan unos ndices y algoritmos de tablas
hash para mejorar los tiempos de accesos a las consultas. Una vez que el
proceso de compilacin se ha acabado, la MDDB est lista para su uso.
Los usuarios solicitan informes a travs del interfase, y la lgica de aplicacin
de la MDDB obtiene el dato.
La arquitectura MOLAP requiere unos clculos intensivos de compilacin. Lee
de datos precompilados, y tiene capacidades limitadas de crear
agregaciones dinmicamente o de hallar ratios que no se hayan precalculados y
almacenados previamente.
Sistemas ROLAP
La arquitectura ROLAP, accede a los datos almacenados en un
Data Warehouse para proporcionar los anlisis OLAP. La premisa de los
sistemas ROLAP es que las capacidades OLAP se soportan mejor contra
las bases de datos relacionales.
El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos
relacional maneja los requerimientos de almacenamiento de datos, y el
motor ROLAP proporciona la funcionalidad analtica. El nivel de base de
datos usa bases de datos relacionales para el manejo, acceso y obtencin del
dato. El nivel
de aplicacin es el motor que ejecuta las consultas multidimensionales de los
usuarios.
El motor ROLAP se integra con niveles de presentacin, a travs de los cules
los usuarios realizan los anlisis OLAP.
Despus de que el modelo de datos para el Data Warehouse se ha definido,
los datos se cargan desde el sistema operacional. Se ejecutan rutinas de bases
de datos para agregar el dato, si as es requerido por el modelos de datos. Se
crean entonces los ndices para optimizar los tiempos de acceso a las consultas.
Los usuarios finales ejecutan sus anlisis multidimensionales, a travs
del motor ROLAP, que transforma dinmicamente sus consultas a consultas SQL.
Se ejecutan estas consultas SQL en las bases de datos relacionales,
y sus resultados se
relacionan mediantetablas
cruzadas y
conjuntos multidimensionales para devolver los resultados a los
usuarios.
La arquitectura ROLAP es capaz de usar datos precalculados si estos estn
disponibles, o de generar dinmicamente los resultados desde los
datos elementales si es preciso. Esta arquitectura accede directamente a los
datos del Data Warehouse, y soporta tcnicas de optimizacin de accesos para
acelerar las consultas. Estas optimizaciones son, entre otras, particionado de los
datos a nivel
de aplicacin, soporte a la desnormalizacin y joins mltiples.
ROLAP vs. MOLAP
Cuando se comparan las dos arquitecturas, se pueden realizar las siguientes
observaciones:
El ROLAP delega la negociacin entre tiempo de respuesta y el
proceso por lotes al diseo del sistema. Mientras, el MOLAP, suele requerir
que sus bases de datos se precompilen para conseguir un rendimiento
aceptable en las consultas, incrementando, por tanto los requerimientos por
lotes.
Los sistemas con alta volatilidad de los datos (aquellos en los que cambian
las reglas de agregacin y consolidacin), requieren una arquitectura que
pueda realizar esta consolidacin ad-hoc. Los sistemas ROLAP
soportan bien esta consolidacin dinmica, mientras que los MOLAP
estn ms orientados hacia consolidaciones por lotes.
Los
ROLAP
pueden
crecer
hasta
un
gran
nmero
de
dimensiones, mientras que los MOLAP generalmente son adecuados para
diez o menos dimensiones.
Los ROLAP soportan anlisis OLAP contra grandes volmenes de
datos elementales,
mientras que los MOLAP se comportan
razonablemente en volmenes ms reducidos (menos de 5 Gb)
Por ello, y resumiendo, el ROLAP es una arquitectura flexible y general, que
crece para dar soporte a amplios requerimientos OLAP. El MOLAP es una
solucin particular, adecuada para soluciones departamentales con unos
volmenes de informacin y nmero de dimensiones ms modestos.
comunes a todos los sitios de estos tesoros hundidos. Con estos modelos en
mano se busca el tesoro donde el modelo indica que en el pasado hubo
ms probabilidad de darse una situacin similar. Con un poco de esperanza, si
tiene
un buen modelo, probablemente se encontrar el tesoro.
OLAP
Data
Warehouse
Usuarios
Data
Mining
Entonces, los pasos tpicos para realizar Data Mining son los siguientes
[Synera, 2002]:
Definicin del problema: de la mima manera que en un
anlisis tradicional, antes de iniciar un proceso de data mining debemos
tener muy claro el problema que queremos resolver.
Recopilacin y preparacin de datos: los datos originales de las
BD transaccionales no estn preparados para el anlisis y, a veces,
es necesario aplicar modificaciones, crear agregados y disear
estructuras nuevas. Adems, muchos mtodos de data mining necesitan
los datos en
un formato especfico.
Data mining: consiste en construir un modelo sobre los datos
con capacidad predictiva y/o descriptiva, de manera que pueda utilizarse
para resolver el problema planteado. Para ello, se emplean tcnicas
estadsticas
o de Inteligencia Artificial.
Validacin: despus de construir el modelo, ste se debe validar antes de
utilizarse. La validacin puede ser de carcter tcnico (utilizar
muestras adicionales de datos para comprobar la capacidad predictiva o
descriptiva del modelo) o conceptual (ver si la interpretacin es
satisfactoria, si el resultado es aplicable). Si el modelo no puede
validarse, es posible que sea necesario aplicar de nuevo el mtodo de
data mining o modificar los datos.
Aplicacin: una vez validado, el modelo debe implementarse en
el proceso
que se
desea
mejorar.
Dependiendo del
proceso, esta implementacin puede ser ms o menos
directa y requerir ms o menos tiempo.
Monitorizacin: debe existir un seguimiento de la implementacin del
modelo en el proceso que se desea mejorar para comprobar sus resultados
reales. Si el resultado no es bueno, es posible que haya que redefinir los
objetivos. Y puede que, an siendo ptimo, sugiera nuevos objetivos que
se pueden alcanzar.
Monitorizacin
Aplicacin
Validacin
Data
Mining
Recogida y
preparacin
de datos
Definicin del
problema
2.5.3.1.1. Qu es un EIS?
EIS se refiere a cualquier sistema de software que muestre informacin
ejecutiva de las diferentes reas del negocio en un solo sistema, facilitando
el monitoreo de la empresa.
El EIS es una tcnica de ms alto nivel dentro de las herramientas de BI. Tiene
como objetivo primordial proveer de toda la informacin necesaria a la gente que
toma decisiones, de modo fcil y prcticamente con una mnima interaccin con el
sistema. En trminos formales, "un EIS es un sistema de informacin que permite
a los ejecutivos acceso rpido y efectivo a informacin compartida, crtica para el
negocio, utilizando interfaces grficas". Las interfaces que son utilizadas en estos
sistemas deben ser ms sofisticadas que los sistemas transaccionales y
deben incluir, en el menor nmero de pginas posible, la mayor cantidad de
informacin
que el usuario necesita para monitorear su empresa.
La funcin principal de un EIS es el monitoreo de la empresa o de una rea de
negocio especfica. Se debe entender que el monitoreo implica una visualizacin
de lo que se quiere controlar y, por tal motivo, no debe existir mayor esfuerzo por
parte del usuario que simplemente ver las consultas que cotidianamente realiza.
La informacin que un EIS presenta es producto de indicadores
empresariales que cotidianamente son evaluados para analizar su
comportamiento y lo que permite determinar su cualidad son las propiedades
que le son asignadas a cada indicador.
Por ejemplo, la cuota de ventas para cada vendedor en una empresa es
un indicador de su productividad dentro de la organizacin. Un vendedor que
haya logrado una cuota de 9,000 USD el mes anterior, tiene una cantidad que,
por si sola, no dice mucho, no se sabe si es buena o mala la cantidad que logr
vender.
La compaa previamente disea las "propiedades" de la mtrica, que son
indicadores para evaluar el comportamiento. Por informacin histrica
se determina que menos de 8,000 USD est considerado como una cuota baja,
entre
8,000 y 10,000 USD se encuentra en un rango normal, y mayor de 10,000 USD es
una cuota alta que merece un bono adicional equivalente a un porcentaje sobre la
diferencia. A cada uno de los calificadores se le asignan ciertas
caractersticas con la intencin de identificar rpidamente el rango en que
se encuentran. Con esta explicacin se podra entender que en este caso,
las consultas para determinar las ventas son predefinidas. Para este ejemplo,
un Director de Ventas puede simplemente abrir una consulta predefinida que
le presente aquellos vendedores con una cuota superior a 10,000 USD, quienes
se harn acreedores a
un bono adicional; de la misma forma puede visualizar fcilmente quienes
no hayan logrado su cuota para tomar decisiones correctivas. En caso de
que el Director deseara ver ms informacin relacionada con un vendedor y
DW
Cubo
del DW
Alarmas y
semforos
EIS
T ablero
de
Control
5
4
3
2
1
Integracin
Administracin
de una sola
pgina
Interfaz grfica
fcil de usar
DW
Cubo
del DW
Tendencias
DSS
5
4
3
OLAP
2
1
Proyecciones
de
informacin
Interfaz grfica
fcil de usar
Proyecciones de Informacin
Las proyecciones de negocio ofrecen al usuario un pronstico de lo que
puede ocurrir en el futuro, basndose en anlisis estadstico y de regresin.
Tendencias
Utiliza la informacin presente y pasada para evaluar el comportamiento de
determinada variable en el tiempo.
Que pasa si...
Anlisis prospectivo de un indicador al modificarse una o ms variables
que inciden en su comportamiento.
BIBLIOGRAFIA