Escolar Documentos
Profissional Documentos
Cultura Documentos
ASIGNATURA:
METOLOGIA DE LA INVESTIGACION
CICLO: IX
ESPECIALIDAD:
INGENIERA DE SISTEMAS Y SEGURIDAD INFORMTICA
AUTOR:
HERNAN VILCAPUMA ALONSO
Lima, 2015
AGRADECIMIENTO
Par poder realizar esta Investigacin de la mejor manera posible fue necesario del
apoyo de muchas personas a las cuales quiero agradecer.
Agradezco la valiosa colaboracin del Profesor Ferrer Maizondo como gua del
curso de Metodologa de la Investigacin durante el desarrollo de la misma.
A los directivos de la Universidad Peruana Simn Bolvar por aperturar el Curso de
Metodologa de la Investigacin
INDICE
INTRODUCCION............5
CAPITULO I
PRESENTACION DE INVESTIGACION........7
1. Formulacin del problema....7
2. Objetivos
2.1. Objetivo general.....9
2.2. Objetivos especficos.....9
Capitulo II
Marco terico...10
3. Fundamentos de los Data Mart Y Data Warehouse...10
3.1 Data Warehouse..................10
3.2 Orientacin al tema...10
3.3 Datos Integrados.......10
3.4 Datos Histricos.11
3.5 Datos no voltiles....................11
4. Diferencia entre un Data Mart y Data Warehouse....................12
5. Data Mart.....................13
5.1 Definiciones generales Data Mart13
5.2 Razones para crear un Data Mart.......13
5.3 Caractersticas Data Mart....................15
5.4 Tipos de Data Mart.....15
Data Mart OLAP...15
Data Mart OLTP...16
6. OLAP VS OLTP.......16
7. Mercados y Tecnologas.17
7.1 Mercado de Datos de Data Mart17
7.2 Tecnologa de Data Mart.17
8, Ventajas y Desventajas de Data Mart.18
9, Arquitectura de Data Warehouse.19
10. Arquitectura de Data Mart...20
11. Importancia de Data Mart y Data Warehouse..21
12. Desarrollo de Data Mart y Data Warehouse.22
BIBLIOGRAFIA..23
CONCLUSION25
INTRODUCCION
Actualmente, en cualquier entidad que procese informacin y que cuente con una
base de datos, sabemos que es necesario que esta se actualice constantemente,
y el propsito de ella es proveer informacin a la empresa con un adecuado
manejo como transformaciones, bsqueda de patrones y consolidaciones.
En este sentido, y puesto que los cambios que se producen actualmente en las
tecnologas y sistemas de informacin son demasiado rpidos, en este proyecto
hacemos un anlisis y diseo de una herramienta llamada Data Warehouse. Esta
tecnologa de la informacin representa el ltimo avance dentro de las bases de
datos, y se configura como el entorno idneo para la consulta y el anlisis de la
informacin procedente tanto de los sistemas transaccionales internos, como de
las fuentes de informacin externas de inters para la empresa.
La finalidad del Data Warehouse consiste en convertir los datos contenidos en las
bases de datos corporativas de las organizaciones, en informacin y sta, a su
vez, en conocimiento til en el proceso de toma de decisiones estratgicas. El
Data Warehouse es una herramienta que va a permitir a los directivos de las
organizaciones formular preguntas, realizar consultas y analizar los datos en el
momento, forma y cantidad que precisen sin necesidad de tener que acudir al
personal informtico de la empresa.
Desde mediados de los aos ochenta, en los que las tecnologas de la
informacin se esforzaban por automatizar los procesos de tipo repetitivo o
administrativo haciendo uso de los sistemas de informacin operacionales, los
Data Warehouse han sufrido una gran evolucin. En los ltimos aos, el concepto
de Data Warehouse ha ido perfeccionndose (gracias al aumento de la capacidad
de almacenamiento, la expansin de internet y las nuevas herramientas de
consulta de datos) y adaptndose a las necesidades crecientes de informacin en
las empresas de forma que los actuales Data Warehouse pueden proporcionar
soluciones a todo tipo de usuarios.
Por ltimo, cabe mencionar la existencia del Data Mart que por ahora podramos
decir que son una versin ms reducida de un Data Warehouse. Estos Data Mart a
5
CAPITULO I
Presentacin de la Investigacin
1. FORMULACION DEL PROBLEMA
Las
empresas
buscan
emplear
dicha
informacin
para
generar
de
tareas
rutinarias
ser
un
proceso
de
verdadera
mismos, de manera que puedan servir como fuente para la toma de decisiones
estratgicas y tcticas.
Esto conlleva a afirmar que los aspectos relativos a la explotacin, el control y la
auditoria de los almacenes de datos cobran gran importancia tanto para los
especialistas informticos como para los directivos de las empresas.
Atendiendo a lo planteado anteriormente, las empresas necesitan sistematizar la
informacin para la toma de decisiones, principalmente aquellas en las que se
identifican grandes volmenes de datos, clientes, productos y transacciones. En
este tipo de organizaciones tambin entrar las educativas.
En el colegio de, CRISTO MILAGROSO ubicado en el distrito de LA VICTORIA,
URB. BALCONCILLO, se encuentra con una gran ineficiencia a la hora de
organizar, ubicar y brindar informes de alumnos matriculados por cada ao de
estudio.
Actualmente todos los datos lo tienen en un documento de Excel, el cual se
encuentra desordenado, disperso y con datos de sobra, dificultando la elaboracin
de informes, asistencias, reportes, que la UGEL pide mensualmente.
La presente investigacin pretender elaborar un buen control para los alumnos
de educacin inicial matriculados en el colegio CRISTO MILAGROSO, donde
realizan el control de asistencia, cantidad de alumnos matriculados por aulas, que
docente se encontrara en cada aula, y el pedido de la UGEL, en cuanto a reportes,
informes y/u otra informacin.
2. OBJETIVOS
2.1 Objetivo General
CAPITULO II
Marco terico
3. FUNDAMENTOS DE LOS DATA MART Y DATA WAREHOUSE
3.1 DATA WAREHOUSE
Segn Bill Immon (1994) se puede definir a un Data Warehouse como una
coleccin de datos orientada a un determinado mbito (empresa, organizacin,
etc.), integrado, no voltil y variable en el tiempo, que ayuda a la toma de
decisiones en la entidad en la que se utiliza.
3.2 ORIENTACION AL TEMA
organizados
generalmente
por
procesos
funcionales.
La
integracin de los diferentes temas en una estructura nica es necesaria para que
la informacin comn a varios temas no se repita.
3.3 DATOS INTEGRADOS
Antes de llegar al Data Warehouse, los datos deben formatearse y unificarse para
llegar a un estado coherente. Un dato debe tener nicamente una descripcin y
una codificacin. Las diferencias que existen en los datos de las fuentes dependen
de la visin deseada por el usuario, de la utilizacin que se hace, o de los
programadores. La integracin de datos constituye una gran parte de la labor de
construir un Data Warehouse y se realiza mediante los proceso de extraccin,
transformacin y carga o procesos ETL.
10
Data Warehouse
Data Mart
Alcance
Corporativo
rea de Negocios
Temas
Multiples
Simples
Fuentes de Datos
Muchas
Pocas
Tamaos
100 GB-TB+
< 100 GB
Tiempo de implementacin
De meses a aos
Meses
11
Fuente
http://download.oracle.com/docs/cd/E10352_01/doc/bi.1013/e10312/dm_concepts.
htm
LOS PROCESOS ETL
Los sistemas ETL (de las siglas en ingles Extraction, Transformation, Load) se
encargan de las funciones de extraccin de distintas fuentes de datos, sean estas
transaccionales o externas, transformacin, realizando tarea de limpieza y
consolidacin de datos y la carga del Data Warehouse o Data Mart.
Entre las principales funciones de los sistemas ETL tenemos (Hernndez, 2003):
-
La extraccin de datos.
El filtrado de datos.
La carga inicial de Data Warehouse o Data Mart.
Refresco del Data Warehouse o Data Mart: Operacin peridica que
actualiza los cambios de las fuentes externas al Data Warehouse o Data
Mart.
5. DATA MART
5.1 Definiciones generales Data Mart
Segn define Meta Group,Un Data Mart es una aplicacin de Data Warehouse,
construida rpidamente para soportar una lnea de negocio simple.
Los Data Marts, tiene las mismas caractersticas de integracin, no volatilidad,
orientacin temtica que el Data Warehouse. Representan una estrategia de
divide y vencers para mbitos muy genricos de un Data Warehouse.
Se define como un pequeo DataWarehouse, para un determinado nmero de
usuarios, para un rea funcional, especifica de la compaa. Tambin podemos
definir que un Data Martes es un subconjunto de una bodega de datos para un
propsito especfico.
.Un Datamart es una base de datos departamental, especializada en el
almacenamiento de los datos de un rea de negocio especfica. Se caracteriza por
disponer la estructura ptima de datos para analizar la informacin al detalle
desde todas las perspectivas que afecten a los procesos de dicho departamento.
Un Datamart puede ser alimentado desde los datos de un DataWareHouse, o
integrar por si mismo un compendio de distintas fuentes de informacin
12
13
Son pobladas por usuarios finales: los usuarios finales con su capacidad
tcnica y conocimientos podrn utilizar el Sistema Data Mart.
Se actualizan constantemente: continuamente los datos van restaurndose.
informacin especfica.
Orientado al tema: Los datos en la base de datos estn organizados de
manera que todos los elementos de datos relativos al mismo evento u
6. OLAP VS OLTP
OLAP o procesamiento analtico en lnea, es el paradigma de anlisis
multidimensional de un Data Warehouse. Este concepto se contrapone al de OLTP
o procesamiento transaccional en lnea, que es el empleado por los sistemas
fuentes para optimizar la recogida de informacin. En pocas palabras, mientras
OLTP se encarga de procesar ptimamente multitud de pequeas transacciones
de captura de informacin (su entrada, modificacin o eliminacin), OLAP se
dedica al anlisis de enormes cantidades de informacin; por ende realizara pocas
transacciones, pero estas procesaran un volumen muy superior (cientos de miles
de registros). (Torres, 2007)
15
7. MERCADOS Y TECNOLOGIAS
7.1 Mercados de datos de Data Mart
Desventajas:
17
18
19
Los Data Mart son un conjunto de modelos de negocio relacionados entre si.
Los Data Marts son diseados para satisfacer las necesidades especficas de
grupos comunes de usuarios (divisiones geogrficas, divisiones
organizacionales, etc.). Los Data Marts son generalmente, subconjuntos del
Data Warehouse, pero pueden tambin integrar un nmero de fuentes
heterogneas, e inclusive ser ms grandes, en volumen de datos, que el propio
Warehouse central.
Los Data Marts son creados para satisfacer las necesidades especficas de
un departamento de acuerdo a los objetivos de los mismos. La Data
Warehouse se crean para satisfacer las necesidades globales de una
corporacin, pero no se puede satisfacer las necesidades de ambos.
Las relaciones en cuanto a temas en los Data Marts no son las mismas que
las que se pueden encontrar en la Data Warehouse.
Los tipos de consultas realizadas en los Data Marts son muy diferentes a
las realizadas en la Data Warehouse.
En los Data Marts los usuarios son relectores de informacin, mientras que
en la Data Warehouse los usuarios son exploradores de informacin.
BIBLIOGRAFIA
22
Univerisidad.
Consultado
y
en
http://www.dsic.upv.es/~jorallo/cursoDWDM/dwdm-I.pdf
Inmon, W.H, (May 28, 1999). Building the Operational Data Store, 2nd
Edition.
2015
en
http://www.eldiarioexterior.com/conocimiento/docs/BI_Inteligencia_aplicada_
al_negocio_pdf
CONCLUSIONES
25