Você está na página 1de 22

Plataforma para la Extracción,

Almacenamiento y Explotación de Información.

Infosoluciones de México, S.A. de C.V.


Contenido

1 Introducción.

2 Arquitectura General de la Plataforma.

3 Modelo de Extracción de Datos.

4 Modelo de Almacenamiento de Datos.

5 Modelo de Explotación de Datos.

6 Proyecto CODA v2

INFOSoluciones de México, S.A. de C.V.


1 Introducción.

INFOSoluciones de México, S.A. de C.V.


Conceptos Básicos.

 CODA es una plataforma enfocada hacia los


requerimientos de inteligencia de negocio de una
organización.
 Integra datos a partir de distintos sistemas
operacionales, obteniéndolos generalmente a
intervalos regulares.
 Contiene información histórica que permite el
análisis y síntesis de indicadores y cifras control en
el tiempo.
 Implementa herramientas para la explotación
organizada de información.

INFOSoluciones de México, S.A. de C.V.


Características Principales.

 Orientación Temática.
CODA es una herramienta que permite la
organización temática de la información.
 Integración.
Integra información a partir de múltiples fuentes de
datos distribuidas en distintos sistemas
operacionales
 No volátil.
Al ingresar un dato en CODA, este no puede ser
modificado
 Variable en el tiempo.
Almacena los valores de los datos durante el
transcurso del tiempo

INFOSoluciones de México, S.A. de C.V.


2 Arquitectura General de la Plataforma.

INFOSoluciones de México, S.A. de C.V.


Arquitectura de la Plataforma.
Fuentes CODA Usuarios
de datos

Procesos de
Extracción, Datos
Sistema Transformación organizados
Operacional y Almacenamiento temáticamente

Análisis

metadatos
Sistema
Componente para la
Operacional
Explotación de
Configuración Información

Componente Reportes
Servidor
de
Web
Archivos Configuración
Planos

INFOSoluciones de México, S.A. de C.V.


Modelo Conceptual.
Datos Distribuidos
DB1 DB2 DBn

Transporte
LAN / WAN

Extracción Unidad Unidad Unidad


Transformación Colectora Colectora Colectora
Carga 1 2 n

Almacén de
Datos
Repositorio Repositorio Repositorio
1 2 n

Consulta de
Información

4
3
2
1

4 4
3 3
2 2
1 1

INFOSoluciones de México, S.A. de C.V.


3 Modelo de Extracción de Datos.

INFOSoluciones de México, S.A. de C.V.


Características.

 Lectura directa de la fuente de datos.


CODA implementa tecnología que permite obtener
información a través de conexiones directas a la fuente
de datos, independientemente del la tecnología y el formato
en que se encuentre.

 Capacidad de transformación.
La plataforma implementa funciones para transformar
datos antes de almacenarlos en los repositorios. Esta
funcionalidad es importante cuando se requiere
homologar información que no esta normalizada en
distintas fuentes de datos.

 Soporte a los metadatos.


Utiliza las definiciones de los metadatos para mapear los
datos colectados hacia el repositorio destino.

INFOSoluciones de México, S.A. de C.V.


Arquitectura de la Unidad Colectora.

Unidad Colectora de Datos


DB1 tiempo
Colector Repositorio
1 Repositorio 1
temporal
LAN / WAN

DB2 Colector
2

DBn Colector Repositorio


n 2

Controlador de Colectores metadatos

Proceso de Extracción, Transformación


y Carga de Datos

INFOSoluciones de México, S.A. de C.V.


Características de un Colector.
 Implementa la conexión a la fuente de datos
 ODBC, FTP

 Conoce las reglas de extracción de datos


 SQL, XML, txt

 Implementa los procesos de transformación


 VB Script, PHP

 Valida la integridad de los datos colectados


 Administración de sesiones de conexión

 Conoce las reglas para almacenar los datos en los repositorios


correspondientes
 El proceso de almacenamiento esta basado en los metadatos que

definen la estructura de los repositorios


 Almacena datos del proceso de colección
 Genera información para validación y revisión posterior a los

eventos de extracción, transformación y almacenamiento.

INFOSoluciones de México, S.A. de C.V.


4 Modelo de Almacenamiento de Datos.

INFOSoluciones de México, S.A. de C.V.


Conceptos Básicos.

 La unidad de almacenamiento en CODA es un


repositorio (una tabla relacional)

 La definición de un repositorio se encuentra en los


metadatos

 Cada repositorio tiene un fundamento temático

 Un repositorio deberá estar diseñado de tal


manera que permita que los datos que contiene,
sean presentados de distintas maneras al usuario

 No existe límite en la cantidad de repositorios, y


estos pueden estar agrupados en conjuntos y en
su totalidad conforman el Almacén de Datos

INFOSoluciones de México, S.A. de C.V.


Modelo Conceptual del Almacén de Datos.

Almacén de Datos
Unidad
Colectora
R R R
1
Datos Distribuidos

Unidad Proceso de
Colectora R R R Explotación
2 de
Información

R R R R

Unidad 4
3

Colectora
2
1

n
metadatos

INFOSoluciones de México, S.A. de C.V.


5 Modelo de Explotación de Datos.

INFOSoluciones de México, S.A. de C.V.


Conceptos Básicos.

 La explotación de información esta basada en “vistas”


 Una vista es una consulta (SQL) a uno de los repositorios del
Almacén de Datos
 Una vista puede ser presentada de manera tabular y/o gráfica
 Una vista es el punto de partida de una consulta de
Información
 El modelo permite ir a una vista a partir del resultado de otra,
acotando datos mediante valores específicos, de manera
recursiva
 Es posible exportar los resultados de una vista a formatos
estandar (MS-excel, XML, texto, etc.)
 En conjunto con un servidor Web, es posible la publicación de
resultados en Internet/Intranet
 Regula el acceso a información utilizando perfiles de usuario e
implementando políticas de acceso

INFOSoluciones de México, S.A. de C.V.


Modelo para la explotación de Información.

Almacén
de Datos

Generador de Servidor
Reporteador
Consultas WEB
R

R Configuración
de Vistas

Base de Datos
de VIstas Administración de
R
Acceso

metadatos Usuarios
Perfiles

INFOSoluciones de México, S.A. de C.V.


7 Proyecto CODA v2.

INFOSoluciones de México, S.A. de C.V.


 Colectores de datos (extracción):
 Componente para la conexión a BdeD (existe un componente
básico)
 Desarrollar colectores asíncronos / automáticos / persistentes /
manejo de excepciones (existen los colectores sincrónicos)

 Colectores de datos (Transformación):


 Desarrollar componente para la transformación de datos
colectados antes de ser almacenados en el repositorio. Posible
uso de scripts

 Colectores de datos (Carga):


 Existen conversiones básicas y mapeos a repositorios (columnas)

 Repositorios
 Administración dinámica (Crear, modificar, eliminar)
 Organización temática de los repositorios

INFOSoluciones de México, S.A. de C.V.


 Explotación
 Desarrollo de componentes para almacenamiento y ejecución de
consultas SQL (vistas) a los repositorios
 Desarrollo del modelo de navegación entre vistas
 Desarrollo de portal web para presentación de información tabular
/ gráfica

 Acceso
 Desarrollo de módulos para la asociación de niveles de seguridad
de acceso a vistas mediante perfiles de operación

 Administración
 Desarrollo de aplicación web para administrar y configurar:
 colectores de datos y su asociación a repositorios

 repositorios de datos organizados temáticamente

 vistas de acceso a repositorios con niveles de acceso

 perfiles de usuario y usuarios

INFOSoluciones de México, S.A. de C.V.


INFOSoluciones de México,
S.A. de C.V.

http://www.infos.com.mx

Você também pode gostar