Você está na página 1de 12

AA4-EV6 - BLOG DE GRUPOS DE TRABAJO

PARA EL DISEÑO DE UNA BODEGA DE DATOS


Y CONSTRUCCIÓN DE UN CUBO.

PRESENTADO POR:
DAVID JOSE MARRUGO GONZALEZ

DOCENTE:
Mgtr. GREGORIO ARTURO BAREÑO MARIN

SERVICIO NACIONAL DE APRENDIZAJE SENA


ESPECIALILZACIÓN TECNOLÓGICA EN GESTIÓN Y
SEGURIDAD DE BASES DE DATOS
2019
CONTENIDO

1. ENFOQUES PARA LA CONSTRUCCIÓN DE CUBOS DE DATOS ......................... 3


2. FASE DE COMPRENSIÓN DEL MODELO DE NEGOCIO....................................... 3
2.1. Dominio del negocio de la organización ............................................................. 3
2.2. Realización del diseño de la bodega y construcción de un cubo de datos para la
secretaria del medio ambiente de la Alcaldía San Antonio del Sena ........................... 3
3. FASE DE LEVANTAMIENTO DE REQUERIMIENTOS: ........................................... 4
3.1. Requerimientos del cubo de datos ..................................................................... 4
4. FASE DE RECOLECCIÓN DE LOS DATOS ............................................................ 5
4.1. Identificación de las fuentes de los datos ........................................................... 5
5. FASE DE PREPARACIÓN DE DATOS .................................................................... 6
6. FASE DE MODELADO DEL CUBO DE DATOS ....................................................... 6
7. FASE DE IMPLEMENTACIÓN DEL CUBO DE DATOS ........................................... 7
7.1. Se crean las tablas de cada una de las dimensiones del cubo con sus respectivos
atributos y llaves primarias ........................................................................................... 7
7.2. Llenado de las dimensiones desde las tablas fuentes ........................................ 8
7.3. Construcción de la tabla de hechos del cubo de datos. ...................................... 9
7.4. Llenado de la tabla de hechos del cubo de datos ............................................... 9
8. FASE DE CONSTRUCCIÓN DEL VISUALIZADOR DEL CUBO DE DATOS ......... 10
8.1. Construir la tabla visualizador ........................................................................... 11
8.2. Llenamos la tabla visualizador .......................................................................... 11
8.3. Exportando los archivos a una hoja de cálculo ................................................. 12
8.4. Vista de los datos en la hoja de cálculo ............................................................ 12
1. ENFOQUES PARA LA CONSTRUCCIÓN DE CUBOS DE DATOS
1.1. Modelos y metodologías para el diseño y construcción de Bodegas de Datos
Para nuestro caso, hemos seleccionado el Modelo de Golfarelli Matteo, Maio Dario
y Rizzi Stefano: Es un esquema que parte de los modelos entidad relación (MER)
de los sistemas transaccionales de la organización, para luego derivar el MER de la
estructura para el diseño de la Bodega de Datos. La metodología mas adecuada
para nuestro diseño es la SEMMA (Sample, Explore, Modify, Model, Assess)

2. FASE DE COMPRENSIÓN DEL MODELO DE NEGOCIO

2.1. Dominio del negocio de la organización

La Alcaldía objeto de estudio es una institución del estado colombiano, que realiza
las funciones de administración local en una población de este país.

Esta Alcaldía está presidida por el alcalde elegido por votación popular, quien
enfrenta una situación de caos administrativo a causa de los malos manejos de la
información y la inadecuada utilización de tecnología para el apoyo a los procesos.
El alcalde de “San Antonio del SENA”, convencido de poder mejorar la situación,
presentó un proyecto de inclusión de tecnología que le fue aprobado por el concejo
y propende en realizar todas las mejoras en las condiciones actuales de manejo de
información de las diferentes dependencias y secretarias de su actual
administración.

Una mejora sensible, se da a través de una reingeniería de procesos enfocados en


la utilización de la información generada por las dependencias de la alcaldía,
pensando en optimizar los tiempos de respuesta y flujo de información para la toma
de decisiones.

2.2. Realización del diseño de la bodega y construcción de un cubo de datos para la secretaria
del medio ambiente de la Alcaldía San Antonio del Sena.
Esta dependencia cuenta con 7 funcionarios quienes están encargados de:
 Gestionar las políticas para la conservación del medio ambiente y protección
de los recursos naturales; ejercer el control y vigilancia del cumplimiento de
estas normas, adelantando investigaciones e imponiendo las sanciones que
correspondan.
 Adicionalmente acompañar y asesorar la pequeña y mediana minería en los
procesos de tecnificación, mejor aprovechamiento de los recursos y su
legalización; también expedir los permisos de movilización forestal.

3. FASE DE LEVANTAMIENTO DE REQUERIMIENTOS:


En esta fase se recolectan datos y se someten a análisis con el fin de transformarlos
en información que permita identificar las necesidades del modelo de negocio de la
organización, esto implica estudiar las interacciones que se dan entre los datos y
los procesos que se llevan a cabo en cada una de las áreas de la organización.

3.1. Requerimientos del cubo de datos


La secretaria del medio ambiente de la Alcaldía de San Antonio del Sena, presenta
información sobre indicadores ambientales en las áreas del municipio, para
diferentes recursos naturales.

ENTIDAD DESCRIPCI
ÓN
En esta entidad se almacenará información como: El nombre
Zona de la zona y el tipo de zona

E único dato almacenado en esta entidad es el nombre del


Recursos recurso

Esta entidad almacena información relacionada con: Nombre


Indicadores del indicador, sigla, topología del indicador, ámbito e indicador.

Estación En esta entidad se almacenará información correspondiente al


Muestreo Nombre de la estación, ubicación y longitud.

Muestra Mensual Esta entidad almacena información como: Fecha, mes y valor

Muestra Esta entidad almacena información como: Fecha, mes y valor


anual
4. FASE DE RECOLECCIÓN DE LOS DATOS
En esta fase se recolectan los datos desde los sistemas fuentes para realizar sobre
ellos una descripción cualitativa y cuantitativa, posteriormente se procede a
determinar sus propiedades y verificar la calidad de los mismos. Esta fase consta
de las siguientes etapas:

4.1. Identificación de las fuentes de los datos


Las fuentes que contienen los datos provienen de Sistemas de información
empresarial (ERP, ERP, FRM, HRM, MRP, SCM), Bases de datos, y Archivos
estadísticos.
Tabla Nº de registros Nº campos Nº relaciones
Zona 7 3 1
Recursos 5 2 1
Indicadores 10 7 3
Estación Muestreo 12 5 2
Muestra Mensual 120 5 1
Muestra anual 66 5 2

Zona: Contiene el nombre de las diferentes zonas


Recursos: Contiene el nombre de los diferentes recursos como: Agua, Aire, Fauna,
Suelo y vegetación
Indicadores: Contiene los diferentes indicadores utilizados para la gestión y el
control de calidad
Estación Muestreo: Contiene la información tomada de las diferentes muestras por
sectores y su ubicación
Muestra Mensual: Contiene la información del indicador y la fecha de toma de la
muestra.
Muestra anual: Contiene la información anual del indicador y la estación muestreo
5. FASE DE PREPARACIÓN DE DATOS

Finalizada la fase de recolección de los datos, se procede al alistamiento de los


datos para la posterior construcción del cubo de datos.
Los datos son que inicialmente están en formato SQL, son exporta a formato de
texto separado por comas CSV, luego pueden ser importados a otros formatos, esto
admite darle un mejor manejo a la información, permitiendo:

 Limpieza de los datos: optimizando la calidad de los datos mediante la


aplicación de diferentes técnicas
 Estructuración de los datos: se realizan operaciones de alistamiento sobre
los datos
 Integración de los datos: se crean nuevas estructuras que unifican los datos
permitiendo crear informes sencillos y de mejor presentación.
 Formateo de los datos: la exportación a una hoja de cálculo permite la
transformación sintáctica de los datos sin modificar su significado.

6. FASE DE MODELADO DEL CUBO DE DATOS


En esta fase se deben identificar los campos, metadatos y datos que se requieren
para construir las dimensiones del cubo de datos.
CAMPOS EXTRAÍDOS DE TABLAS
DIMENSIÓN TABLAS FUENTE
FUENTES
MUESTRA_MENSUAL ID_MUESTRA_MENSUAL, INDICADOR, FECHA
D_MUESTRA_MENSULA ID_INDICADOR, NOMBRE_INDICADOR,
INDICADOR
TIPO_INDICADOR, DESCRIPCION
RECURSO NOMBRE_RECURSO
D_RECURSO ID_INDICADOR, NOMBRE_INDICADOR,
INDICADOR
TIPO_INDICADOR, DESCRIPCION
MUESTRA_ANUAL ID_MUESTRA_ANUAL, INDICADOR, FECHA
D_MUESTRA_ANUAL ID_INDICADOR, NOMBRE_INDICADOR,
INDICADOR
TIPO_INDICADOR, DESCRIPCION
7. FASE DE IMPLEMENTACIÓN DEL CUBO DE DATOS
Procedemos a la construcción física del cubo de datos

7.1. Se crean las tablas de cada una de las dimensiones del cubo con sus respectivos
atributos y llaves primarias

--Creando la Tabla D_MUESTRAANUAL


CREATE TABLE D_MUESTRAANUAL (
idMuestraAnual NUMBER PRIMARY KEY NOT NULL,
idIndicador NUMBER NOT NULL,
Fecha NUMBER NOT NULL,);

-- Creando la tabla Muestra Mensual

CREATE TABLE D_MUESTRAMENSUAL (


IdMuestra Mensual NUMBER PRIMARY KEY NOT NULL,
idIndicador NUMBER NOT NULL,
Fecha NUMBER NOT NULL,);

--Creando la Tabla Recursos


CREATE TABLE D_RECURSO (
idRecurso NUMBER PRIMARY KEY NOT NULL,
Nombre Recurso varchar (25) NOT NULL);

7.2. Llenado de las dimensiones desde las tablas fuentes

--Insertando registros a la tabla Recurso


INSERT INTO Recurso (idRecurso, NombreRecurso) VALUES (6, 'Agua');
INSERT INTO Recurso (idRecurso, NombreRecurso) VALUES (7, 'Aire');
INSERT INTO Recurso (idRecurso, NombreRecurso) VALUES (8, 'Fauna');
INSERT INTO Recurso (idRecurso, NombreRecurso) VALUES (9, 'Suelo');
INSERT INTO Recurso (idRecurso, NombreRecurso) VALUES (10, 'Vegetación y
Arbolado');
--Insertando registros en la tabla MuestraAnual
INSERT INTO MuestraAnual ( idMuestraAnual , idIndicador, Fecha)
VALUES (1, 59, 1999);
INSERT INTO MuestraAnual ( idMuestraAnual , idEstacionMuestreo , idIndicador,
Fecha)
VALUES (2, 59, 2000);
INSERT INTO MuestraAnual ( idMuestraAnual , idEstacionMuestreo , idIndicador,
Fecha)
VALUES (3, 59, 2001);
INSERT INTO MuestraAnual ( idMuestraAnual , idIndicador, Fecha)
VALUES (4, 59, 2002);

--Insertando registros en la tabla MuestraMensual


INSERT INTO MuestraMensual ( idMuestraMensual , idIndicador , Fecha) VALUES
(1, 120, 2004);
INSERT INTO MuestraMensual ( idMuestraMensual , idIndicador , Fecha) VALUES
(2, 120, 2004);
INSERT INTO MuestraMensual ( idMuestraMensual , idIndicador , Fecha) VALUES
(3, 120, 2004);
INSERT INTO MuestraMensual ( idMuestraMensual , idIndicador , Fecha) VALUES
(4, 120, 2004);

7.3. Construcción de la tabla de hechos del cubo de datos.

--Creando la Tabla D_INDICADOR


CREATE TABLE D_INDICADOR (
idIndicador NUMBER PRIMARY KEY NOT NULL,
idRecurso NUMBER NOT NULL,
NombreIndicador varchar (200) NULL,
TipoIndicador varchar (30) NOT NULL,
Descripcion varchar (1000) NULL);

7.4. Llenado de la tabla de hechos del cubo de datos

INSERT INTO Indicador (idIndicador , id Recurso, Nombre Indicador, Tipo Indicador,


Descripción )
VALUES (130, 6, „Carga Contaminante de Sólidos Suspendidos Totales‟, „Urbano‟,
'Este indicador hace referencia a la mediana estadística mensual de la carga de
sólidos suspendidos totales vertida por la muestra de industrias que se les realiza
control en el marco del programa de seguimiento de efluentes industriales y usuarios
objeto de seguimiento ambiental en el tema de vertimientos');

INSERT INTO Indicador (idIndicador , idRecurso, NombreIndicador, TipoIndicador,


Descripcion )
VALUES (200, 7, 'Dióxido de Azufre Promedio Anual', 'Urbano', 'La contaminación
atmosférica tiene su origen en los gases y partículas transportadas por el aire que,
sialcanzan niveles excesivos, resultan nocivos para la salud humana, las obras de
arte y los ecosistemas.');

INSERT INTO Indicador (idIndicador , idRecurso, NombreIndicador, TipoIndicador,


Descripcion )
VALUES (210, 7, 'Ozono Promedio 8 horas Anual', 'Urbano', 'El Ozono O3 es un
gas azul pálido que, en las capas bajas de la atmósfera, se origina como
consecuencia de las reacciones entre los óxidos de nitrógeno y los hidrocarburos
(gases compuestos de carbono e hidrógeno principalmente); en presencia de la luz
solar. Es un oxidante fuerte, muy fácil de producir pero a la vez muy fácil de destruir;
es el compuesto más representativo de los compuestos fotoquímicos. Sus efectos
en el sistema respiratorio son de cuidado ya que es un gas altamente oxidante e
irritante.');

INSERT INTO Indicador (idIndicador , idRecurso, NombreIndicador, TipoIndicador,


Descripcion )
VALUES (500, 9, 'Árboles Plantados', 'Urbano', 'El indicador representa el avance
en el número de árboles plantados por el Jardín Botánico de Bogotá José Celestino
Mutis, a través de convenios con entidades INTEGEReresadas en participar de
procesos de arborización urbana, gestión con participación ciudadana e institucional
y plantación directa.');

8. FASE DE CONSTRUCCIÓN DEL VISUALIZADOR DEL CUBO DE DATOS


Pasamos a crear una consulta sobre las dimensiones del cubo de datos de manera
que proporcione algunos elementos claves que permitan interpretar más fácilmente
los datos arrojados por la tabla de hechos, luego procedemos a visualizarlo en una
hoja de cálculo de Excel.

8.1. Construir la tabla visualizador


En esta tabla almacenaremos los resultados de la consulta

--Creando la Tabla visualizador


CREATE TABLE VISUALIZADOR (
IDINDICADOR NUMBER PRIMARY KEY NOT NULL,
IDRECURSO NUMBER NOT NULL,
NOMBREINDICADOR VARCHAR (200) NULL,
TIPOINDICADOR VARCHAR (30) NOT NULL,
DESCRIPCION VARCHAR (1000) NULL);

8.2. Llenamos la tabla visualizador

INSERT INTO INDICADOR (IDINDICADOR, IDRECURSO, NOMBREINDICADOR,


TIPOINDICADOR, DESCRIPCION) VALUES (320, 9, „Disposición de Residuos en
el Relleno Sanitario Doña Juana‟, „DRRSDJ‟, „Los residuos sólidos, comúnmente
llamados basuras, se han convertido en un factor que amenaza la salud humana y
el medio ambiente por su alto volumen de generación en las ciudades.‟);
8.3. Exportando los archivos a una hoja de calculo

8.4. Vista de los datos en la hoja de calculo

Você também pode gostar